互联网运维 ip_local_port_range 调到最大值后仍然 bind: Address already in use 的根因 bind: Address already in use 错误与 ip_local_port_range 无关 […]
互联网运维 strace -f -e trace=network 发现大量 connect/reset 的业务排查 大量 connect 后立即返回 ECONNREFUSED 或 RST,主因是业务代码反复连接未监听的地址 / […]...
互联网运维 iSCSI session 频繁 logout/login 的 timeout 与 MPIO 配置优化 iSCSI session 反复 logout/login 是内核驱动主动重建会话所致,主因包括网络抖动、NO […]...
互联网运维 systemd-oomd 杀错进程或不杀的优先级/score 配置经验 systemd-oomd 不依赖 /proc/*/oom_score_adj 直接排序,而是综合 OOMSco […]
互联网运维 服务器随机丢包但 ping 延迟正常的 perf + bpftrace 抓包定位 ping 延迟正常但业务连接频繁超时或重传,因 ping 走独立 ICMP 路径,而 TCP 业务丢包可能发生 […]...
互联网运维 大量 ESTABLISHED 连接残留但进程已退出导致端口耗尽的清理方法 存在无主 ESTABLISHED 连接:进程崩溃或未调用 close()退出时,内核不回收 socket,连接 […]...
互联网运维 chronyc tracking Root dispersion 异常高的上游 NTP 源问题处理 Root dispersion 过高表明上游 NTP 源不稳定或路径存在严重抖动、丢包等问题,导致时间同步质量 […]...