/ proc/meminfo Committed_AS 远超物理内存+swap 的 overcommit 风险

4次阅读

Committed_AS 远超物理内存加 Swap 不必然导致崩溃,但存在 overcommit 风险;它是内核承诺的最大虚拟内存总量,包含未实际使用的预分配内存、tmpfs 文件、大页预留等,其“虚高”源于逻辑承诺而非物理占用。

/ proc/meminfo Committed_AS 远超物理内存 +swap 的 overcommit 风险

Committed_AS 远超物理内存加 Swap,并不必然导致系统崩溃,但确实意味着内核已承诺分配远超可用资源的内存,存在明显的 overcommit 风险。 关键在于 Linux 的内存承诺(commit)是逻辑层面的“签单”,不是即时分配;真正危险的是当进程实际写入(touch)这些页、而系统又无法满足时,OOM killer 可能被触发。

Committed_AS 是什么,为什么 它会“虚高”?

Committed_AS 表示内核当前承诺可提供的最大 虚拟内存 总量(单位:KB),包括所有已分配但未必驻留的内存(如 malloc 后未写入的页、匿名映射、tmpfs 等)。它不是已使用的物理内存,而是“未来可能需要的上限”。以下情况会让它显著膨胀:

  • 大量进程调用 malloc 分配内存但尚未写入(例如预分配缓冲区、JVM 堆预留但未填满)
  • 启用 tmpfs 或 ramfs 且挂载点下创建了大文件(tmpfs 占用计入 Committed_AS)
  • 使用了大页(HugeTLB)或透明大页(THP)的预留机制
  • 容器环境(如 Docker)中,多个容器各自申请大量虚拟地址空间,叠加后迅速推高该值

overcommit 模式决定风险等级

Linux 通过 /proc/sys/vm/overcommit_memory 控制内存承诺策略,共三种模式:

  • 0(启发式,默认):内核估算是否“大概够用”,对 malloc 大量未触内存较宽松,但 Committed_AS 显著超限仍可能拒绝新分配或触发 OOM
  • 1(总是允许):完全不检查,任何 malloc 都成功 —— Committed_AS 可无限增长,OOM 风险最高
  • 2(严格模式):Committed_AS ≤ /proc/sys/vm/overcommit_ratio% × 物理内存 + Swap。超过即直接返回 ENOMEM,最安全但可能误拒合法请求

运行 cat /proc/sys/vm/overcommit_memory 查看当前模式;若值为 0 或 1,且 Committed_AS 持续 > 1.5×(RAM+Swap),需警惕。

如何判断是否真有危险?

光看 Committed_AS 数值不够,要结合实时行为分析:

  • 检查 /proc/meminfoMemAvailable 是否持续低于 5% 总内存 —— 表明物理页回收已吃紧
  • 观察 dmesg -T | grep -i “out of memory” 是否有 OOM 日志
  • ps aux –sort=-%mem | head -10 找真实 内存占用 大户,对比其 RSS 与 VIRT(虚拟内存大小)差距
  • 运行 cat /proc/sys/vm/oom_kill_allocating_task:若为 0(默认),OOM killer 会杀掉“最占内存”的进程而非触发者;若为 1,则直接杀当前申请失败的进程(更可控)

缓解 overcommit 风险的实用操作

无需立即扩容,优先从配置和应用侧入手:

  • 将 overcommit_memory 设为 2,并合理设置 overcommit_ratio(例如 80~90,留余量给内核开销)
  • 限制 tmpfs 大小:mount -o remount,size=2G /dev/shm
  • 对 Java 应用,显式设置 -Xmx 并启用 -XX:+UseContainerSupport(容器环境)避免 JVM 高估可用内存
  • 定期用 smem -s pss 查看 PSS(按比例分摊的物理内存占用),比 RSS 更真实反映内存压力
text=ZqhQzanResources