互联网运维 ethtool -S 显示 rx_missed_errors 或 rx_no_buffer_count 增长的处理 rx_missed_errors 或 rx_no_buffer_count 持续增长表明网卡接收队列满、内核处 […]...
互联网运维 sysctl tcp_tw_reuse=1 后 TIME_WAIT 仍堆积的 SO_REUSEADDR 场景 tcp_tw_reuse= 1 在 SO_REUSEADDR 缺失时无效,因其仅适用于客户端主动连接且依赖 P […]...
互联网运维 TCP out of memory — consider tuning tcp_mem 报错后的参数调整经验 TCP 缓冲区内存耗尽需调优 tcp_mem 三元组:low 为无压力阈值,pressure 触发缓冲区收缩与 […]...
互联网运维 journalctl -u 服务名 不显示日志或丢失最近条目的常见配置坑 journalctl -u 服务名查不到日志的四大原因:一是 journald 未持久化,日志仅存内存;二是服 […]...
互联网运维 大量 ESTABLISHED 连接但进程已退出导致端口耗尽的残留 socket 清理 进程退出后未正确关闭 TCP 连接会导致内核残留 ESTABLISHED 状态 socket,引发端口耗尽;可 […]...
互联网运维 ss -ant 显示大量 SYN_RECV 但防火墙没规则的根因分析 大量 SYN_RECV 堆积说明服务器已发 SYN-ACK 但未收到 ACK,连接卡在半开状态,占用 syn […]...
互联网运维 strace -p 挂上后卡在 futex_wait 或 poll 的锁等待深挖方法 strace -p 显示卡在 futex_wait 或 poll 表明进程正阻塞于内核态等待同步事件或 I/O […]...
互联网运维 crontab -l 显示为空但任务仍在执行的系统级 /etc/cron.d/ 隐藏任务 crontab -l 显示为空但任务仍在运行,是因为任务定义在系统级目录(如 /etc/cron.d/、/et […]...
互联网运维 Cilium 安装后 pod 间通信不通但 node 到 pod 通的典型情况 Cilium 跨节点 Pod 通信失败的核心原因是隧道 / 直连模式未正确配置:需检查 cilium stat […]...
互联网运维 haproxy backend health check 失败但 curl 直连正常的协议/路径坑 HAProxy 健康检查失败而 curl 正常,主因是协议 / 路径不一致:HTTP/1.0 无 Host 头 […]...