swap 使用率高但 free available 充足的 vm.overcommit_memory=1 风险评估

14次阅读

不危险,但需确认高 swap 使用是否由真实内存压力驱动;若 pgmajfault 激增、oom_kill 频发或响应延迟则危险,否则可能是内核良性换出闲置页。

swap 使用率高但 free available 充足的 vm.overcommit_memory=1 风险评估

vm.overcommit_memory=1 下 swap 使用率高但 MemAvailable 充足是否危险?

不危险,但需确认高 swap 使用是否由真实内存压力驱动,还是内核主动换出闲置页所致。在 vm.overcommit_memory=1(启发式检查)模式下,内核不会严格限制 malloc,但也不会盲目允许超配;swap 升高本身不是故障信号,关键看是否伴随 pgmajfault 激增、oom_kill 日志或响应延迟。

如何判断 swap 增长是良性换出还是恶性缺页?

运行以下命令交叉验证:

  • grep -i "pgmajfault|pgpgin|pgpgout" /proc/vmstat —— 若 pgmajfault 持续 > 100/s 且与应用卡顿同步,说明频繁缺页,swap 已成瓶颈
  • cat /proc/meminfo | grep -E "(MemAvailable|SwapCached|SwapTotal|SwapFree)" —— 若 SwapCachedSwapTotal 70%+,大概率是内核把干净页换出后未回收,属低开销行为
  • pidstat -r -p $(pgrep -f your_app) 1 —— 观察单进程 minflt/s(次缺页)和 majflt/s(主缺页),后者突增才值得警惕

vm.overcommit_memory=1 的实际约束边界在哪?

该模式下,内核用简单公式估算:允许分配 ≤ MemTotal + SwapTotal * 0.5(具体系数由 vm.overcommit_ratio 控制,默认 50)。它不阻止 swap 使用,但会拒绝明显越界的 malloc 请求。风险点在于:

  • MemAvailable 高但大量匿名页被换出时,若突发申请大块内存(如 JVM 堆扩容),可能因无足够物理页立即满足而触发 OOM killer
  • 某些应用(如 PostgreSQL)依赖 mlock 锁定内存,若其锁定范围超过 MemAvailable,即使总内存充足也会失败
  • vm.overcommit_memory=1 对透明大页(THP)分配更保守,可能加剧内存碎片,间接推高 swap 使用

什么情况下应调低 swapiness 或改用 overcommit=2?

仅当出现以下任一情况才需干预:

  • 监控到 /var/log/messages 中反复出现 Out of memory: Kill process,且被杀进程 RSS 远低于 MemTotal
  • swapon --show 显示 swap 使用持续 > 80%,同时 cat /proc/sys/vm/swappiness ≥ 60 且业务无明确 swap 友好设计(如 Redis 禁用 swap)
  • 应用为延迟敏感型(如高频交易中间件),即使 MemAvailable > 4GB,也要求所有热数据常驻 RAM,此时设 vm.swappiness=1 并配合 overcommit_memory=2 + 合理 vm.overcommit_ratio 更可控

真正容易被忽略的是:swap 使用率统计包含 SwapCached(已换出但尚未被覆盖的干净页),这部分可瞬时回载,不消耗 I/O。别只盯着 free -hSwapUsed 数字做决策。

text=ZqhQzanResources