互联网运维 Linux 服务器 CPU steal 时间(st)持续偏高但宿主机负载不高 CPU steal 时间(st)持续偏高是虚拟化层资源调度异常的典型信号,反映 VM 等待 hyperviso […]...
互联网运维 ping 通但 curl/telnet 端口不通的6种典型网络层问题对比 ping 通但 curl 或 telnet 连不上,说明 ICMP 通而 TCP 不通,常见原因有 6 种:1 […]...
互联网运维 K3s 集群节点突然变成 NotReady – NetworkPluginNotReady Flannel Pod 未就绪是 CNI 插件异常的主因,需检查其状态、镜像、磁盘、权限、网卡名及后端模式(h […]...
互联网运维 进程进入 D 状态(uninterruptible sleep)kill -9 无效的安全处理 D 状态进程无法被 kill – 9 终止,因其正执行不可中断的内核操作;需通过 ps 和 wchan 定位阻 […]...
互联网运维 残留 veth 接口如何关联到对应 pod/container 并批量删除 残留 veth 接口源于 Pod 强制删除、运行时异常或 CNI 清理失败,需先通过 netns inode […]...
互联网运维 perf top 实时显示 [kworker] 或 [ksoftirqd] 热点时的下一步分析 当 perf top 显示 [kworker] 或 [ksoftirqd] 占用高 CPU,表明内核线程正高频 […]...
互联网运维 进程被 OOM kill 但 oom_score_adj=-1000 仍被选中的 systemd-oomd 规则 systemd-oomd 不尊重 oom_score_adj 值,包括 -1000;其豁免仅依赖 OOMPre […]...