📄️ 节点 Crash 与 Vmcore 分析
本文介绍节点 Crash 后如何分析 vmcore 进行排查。
📄️ 节点高负载
Kubernetes 节点高负载如何排查?本文来盘一盘。
📄️ IO 高负载
系统如果出现 IO WAIT 高,说明 IO 设备的速度跟不上 CPU 的处理速度,CPU 需要在那里干等,这里的等待实际也占用了 CPU 时间,导致系统负载升高,可能就会影响业务进程的处理速度,导致业务超时。
📄️ 内存碎片化
判断是否内存碎片化严重
📄️ 磁盘爆满
什么情况下磁盘可能会爆满 ?
📄️ PID 爆满
如何判断 PID 耗尽
📄️ ARP 表爆满
判断 arp_cache 是否溢出
📄️ inotify 资源耗尽
inotify 耗尽的危害
📄️ soft lockup (内核软死锁)
内核报错
📄️ no space left on device
- 有时候节点 NotReady, kubelet 日志报 no space left on device。
📄️ IPVS no destination available
现象
📄️ cAdvisor 无数据
可能原因