LinuxNUMA架构影响性能_NUMA调优实践

16次阅读

linux numa 调优关键在于使内存分配、线程调度与硬件拓扑对齐：先用 numactl –hardware 和 lscpu 确认 numa 启用及拓扑，再通过 numactl 绑定 cpu/ 内存节点、taskset 固定线程、jvm 参数或 worker_cpu_affinity 实现本地化访问，必要时微调 vm.zone_reclaim_mode 和 kernel.numa_balancing。

LinuxNUMA 架构影响性能_NUMA 调优实践

Linux 系统在 NUMA（Non-Uniform Memory Access）架构下，内存访问延迟和带宽因 CPU 与内存节点的物理距离而异，不当的内存分配或进程绑定会显著拖慢性能。关键不是“禁用 NUMA”，而是让内存分配、线程调度与硬件拓扑对齐。

看清当前 NUMA 拓扑

运行 numactl –hardware 查看节点数量、每个节点的 CPU 列表和内存容量；用 lscpu | grep -i numa 确认是否启用 NUMA 支持。注意：有些 BIOS 默认关闭 NUMA，需手动开启才能生效。若显示单节点（Node 0 only），后续调优无从谈起。

避免跨节点内存分配

默认情况下，进程可能在任意节点分配内存，导致远端访问。可通过以下方式约束：

启动时指定节点：numactl –membind=1 –cpunodebind=1 ./app，强制进程只使用节点 1 的 CPU 和内存
对已有进程，用 numactl –interleave=all 可缓解内存不均（适合读多写少、对延迟不敏感的服务）
检查实际内存分布：numastat -p ，重点关注 numa_hit 与 numa_foreign 比值，foreign 偏高说明频繁跨节点访问

绑定线程与本地内存节点

多线程应用（如数据库、Java 服务）易因线程迁移引发远程内存访问。建议：

用 taskset -c 4-7 将线程固定到特定 CPU 核心，再配合 numactl –membind 绑定对应内存节点
JVM 可添加参数：-XX:+UseNUMA -XX:NUMAInterleavingRatio=1（JDK 8u262+），自动按节点划分堆内存
Nginx/Apache 等多 worker 模型，通过 worker_cpu_affinity auto 或脚本为每个 worker 绑定独立节点

内核参数微调（谨慎使用）

多数场景无需改内核参数，但以下两项在高并发内存密集型负载中值得验证：

vm.zone_reclaim_mode=1：启用本地节点内存回收，减少跨节点分配（默认为 0，即优先从其他节点分配）
kernel.numa_balancing=0：关闭自动 NUMA 平衡（默认开启），避免后台线程迁移动态增加开销；适用于已手动绑定且负载稳定的场景

修改后需结合 numastat 和应用延迟指标对比验证，切勿盲目启用。

发表于：互联网运维

2026-03-11

复制链接

Linux 系统重启后配置丢失的根因

Linux集中日志方案设计_日志集中化架构

Linux多服务协同部署_依赖与顺序控制方案【教程】

Linux TIME_WAIT过多_端口耗尽调优

SQL权限怎么管理_数据库权限设计

LinuxNUMA架构影响性能_NUMA调优实践

看清当前 NUMA 拓扑

避免跨节点内存分配

绑定线程与本地内存节点

内核参数微调（谨慎使用）

狗狗币、PEPE、SHIB……MEMEcoin为什么总能暴涨？

欧易OKX app官方版安装欧易官方获取渠道地址

芝麻开门app官方下载入口 Gate.io交易所App官方获取渠道

2026欧易OKX苹果版App下载入口欧易官方App v6.202.0 iOS最新版

火币HTX交易所2026最新备用入口火币官方安卓最新版APP直连下载

火币HTX app官方版下载火币交易所安全获取渠道

比特币交易平台官方登录页面 Bitcoin App手机版最新登录入口

2026芝麻开门Gate.io官网防失联链接芝麻开门App v5.2.0 安卓官方版