|
IBM RSCT(Reliable Scalable Cluster Technology)提供了一套完整的集群资源监控机制,IBM CSM(Cluster System Management)利用此机制预定义了很多用于资源监控的 Condition、Response 和 Association,具体可参见 CSM 的用户手册。但是,CSM 并没有提供用于监控集群中进程的预定义 Condition、Response 和 Association。本文将介绍如何利用 RSCT 资源类 IBM.Program 和 CSM 相关配置命令来监控集群中的进程,同时说明如何对 GPFS 和 LoadLeveler 的关键守护进程进行监控。 |