互联网运维 ping 通但 curl/telnet 端口不通的6种典型网络层问题对比 ping 通但 curl 或 telnet 连不上,说明 ICMP 通而 TCP 不通,常见原因有 6 种:1 […]...
互联网运维 K3s 集群节点突然变成 NotReady – NetworkPluginNotReady Flannel Pod 未就绪是 CNI 插件异常的主因,需检查其状态、镜像、磁盘、权限、网卡名及后端模式(h […]...
互联网运维 进程进入 D 状态(uninterruptible sleep)kill -9 无效的安全处理 D 状态进程无法被 kill – 9 终止,因其正执行不可中断的内核操作;需通过 ps 和 wchan 定位阻 […]...
互联网运维 残留 veth 接口如何关联到对应 pod/container 并批量删除 残留 veth 接口源于 Pod 强制删除、运行时异常或 CNI 清理失败,需先通过 netns inode […]...
互联网运维 perf top 实时显示 [kworker] 或 [ksoftirqd] 热点时的下一步分析 当 perf top 显示 [kworker] 或 [ksoftirqd] 占用高 CPU,表明内核线程正高频 […]...
互联网运维 进程被 OOM kill 但 oom_score_adj=-1000 仍被选中的 systemd-oomd 规则 systemd-oomd 不尊重 oom_score_adj 值,包括 -1000;其豁免仅依赖 OOMPre […]...
互联网运维 大量 sudo session 日志刷屏的 pam_limits 与 rsyslog 限流方案 应关闭 pam_limits.so 的 debug 日志并为 rsyslog 添加速率限制;具体操作是删除 / […]...
互联网运维 xfs_repair -L 强制清日志后数据丢失风险评估与备份优先级 xfs_repair -L 是高危操作,会强制清空日志导致未落盘事务数据永久丢失,仅在日志确凿损坏、无重要数据 […]...
互联网运维 / etc/ld.so.preload 被篡改后门如何检测与清理 /etc/ld.so.preload 被篡改是高危后门,需立即检查文件存在性与内容、定位并删除恶意 so 库、 […]...
互联网运维 sudoers 配置语法错误导致所有用户 sudo 失效的 recovery 单用户模式 当 /etc/sudoers 语法错误时,sudo 命令全部失效,需进 GRUB 单用户模式修复:按 Shif […]...