集群巡检¶
集群巡检可以自动定期地,或手动随时地检查集群的整体健康状态,让管理员获得保障集群安全的主动权。在合理的巡检计划基础上,这种主动自发的集群检查可以让管理员随时掌握集群状态,发掘潜在风险并提前防范,而不是在出现故障时被动地排查问题。
DCE 5.0 容器管理模块提供集群巡检功能,支持从集群维度、节点维度、容器组维度进行巡检。
- 集群维度:检查集群中系统组件的运行情况,包括集群状态、资源使用情况,以及控制节点特有的巡检项等,例如
kube-apiserver
和etcd
的状态。 - 节点维度:包括控制节点和工作节点通用的检查项,例如节点资源使用情况、句柄数、PID 状态、网络状态。
- 容器组维度:检查 Pod 的 CPU 和内存使用情况、运行状态、PV 和 PVC 的状态等。