今天在新建北京区域的K8S集群时,一切如往常一样,一步一步的进行着,仿佛一切都是这么的自如,就在我部署好metrics-server时,正打算尝试API的工作情况时,发现只能获取master的资源,这就很奇怪了,为什么别的节点都无法获取指标信息呢,于是检查了网络没有发现异常,此时我怀疑可能是北京另一机房的安全端口没有打开,于是对基础网络进行了排查,均无问题。
OK,到此时,我只能去看kubelet的日志了,发现了异常
E0704 15:20:03.875017 7912 kubelet.go:1292] Image garbage collection failed once. Stats initialization may not have completed yet: failed to get imageFs info: unable to find data in memory cache
E0704 15:20:03.920105 7912 kubelet.go:1853] skipping pod synchronization - [container runtime status check may not have completed yet, PLEG is not healthy: pleg has yet to be successful]
这个问题官方社区早有定论
https://github.com/kubernetes/kubernetes/issues/76820
由于我们cgroupdriver使用了systemd,因此我们需要升级systemd
在此我建议新建集群时,先执行一次yum update -y
如果操作系统本身较新可能无此问题。