·群集守護(hù)程序:cmcld
該守護(hù)程序通過向Serviceguard群集內(nèi)其他節(jié)點(diǎn)上的cmcld守護(hù)程序發(fā)送心跳線消息,來確定群集中的成員。它按照實(shí)時(shí)優(yōu)先級(jí)運(yùn)行且鎖定在內(nèi)存中。cmcld守護(hù)程序在內(nèi)核中設(shè)置了一個(gè)安全計(jì)時(shí)器,用于檢測(cè)內(nèi)核掛起。如果此計(jì)時(shí)器未由cmcld定期復(fù)位,則內(nèi)核將產(chǎn)生系統(tǒng)TOC(目口控制轉(zhuǎn)移),這意味著CPU復(fù)位和創(chuàng)建崩潰轉(zhuǎn)儲(chǔ)文件。發(fā)生這種情況的原因可能是cmcld無法與大多數(shù)群集成員通信;或者是因?yàn)閏mcld異常退出、異常中止,或無法運(yùn)行足夠長(zhǎng)的時(shí)間并且無法更新內(nèi)核計(jì)時(shí)器(從而表明內(nèi)核掛起)。在因安全計(jì)時(shí)器過期而導(dǎo)致TOC之前,消息將會(huì)寫入/var/adm/syslog/syslog.log文件和內(nèi)核的消息緩沖區(qū)中。cmcld守護(hù)程序還檢測(cè)系統(tǒng)中網(wǎng)絡(luò)運(yùn)行是否正常并執(zhí)行本地局域網(wǎng)故障切換。最后,該守護(hù)程序負(fù)責(zé)Serviceguard程序包的管理,確定在何處運(yùn)行它們以及何時(shí)啟動(dòng)它們。注釋Serviceguard的三個(gè)核心組件——程序包管理器、群集管理器以及網(wǎng)絡(luò)管理器——都作為cmcld守護(hù)程序的組成部分運(yùn)行。該守護(hù)程序在所有群集節(jié)點(diǎn)上都以20的優(yōu)先級(jí)運(yùn)行。因此用戶進(jìn)程一定要以低于20的優(yōu)先級(jí)運(yùn)行,否則它們可能使Serviceguard無法更新內(nèi)核安全計(jì)時(shí)器,這將導(dǎo)致節(jié)點(diǎn)上出現(xiàn)TOC。