diff 用于文本文件行级差异比较,cmp 用于任意文件逐字节比对;前者适合代码配置等场景,后者适用于二进制一致性验证。

Linux 中比较文件内容,diff和 cmp 是最常用的两个命令,但它们用途不同:diff 适合查看文本文件的行级差异,cmp 则用于逐字节比对任意文件(包括二进制),精度更高。
diff:对比文本文件的行变化
diff 默认以“统一格式”(unified diff)输出,清晰标出哪些行被添加、删除或修改。适合代码、配置文件、日志等纯文本场景。
- 基本用法:diff file1.txt file2.txt —— 显示差异行及上下文
- 常用选项:-u(统一格式,推荐)、-r(递归比较目录)、-q(仅报告是否不同,不显示详情)
- 配合 vimdiff 可交互式查看并编辑差异,适合合并修改
- 注意:diff 会忽略空行、缩进或换行符差异(除非加 -b 或-w等选项调整敏感度)
cmp:逐字节比对,精准判断二进制是否一致
cmp 不关心文件内容是否“可读”,它把文件当作字节流处理,一旦发现第一个不同字节就停止,默认只报告位置和 ASCII 值。
- 基本用法:cmp file1.bin file2.bin —— 若相同则无输出;不同则提示首个差异字节的偏移(从 0 开始)和对应字符
- 常用选项:-l(列出所有不同字节的偏移与值)、-s(静默模式,仅通过退出码判断:0= 相同,1= 不同,2= 错误)
- 适合验证下载完整性、镜像文件一致性、编译前后二进制是否变化等场景
- 不能直接看出“逻辑差异”,比如两个 PNG 图片视觉一样但 IDAT 块顺序不同,cmp 仍会报不一致
怎么选?看文件类型和需求
不是“哪个更好”,而是“哪个更合适”:
- 比对 shell 脚本、JSON、Markdown 等——用diff -u
- 确认两个 tar 包 /ISO 镜像 / 可执行文件是否完全一致——用cmp -s(配合 if 语句做自动化判断)
- 想定位二进制中哪几个字节变了——用cmp -l | head
- 需要可视化合并或打补丁——diff 生成的。patch 文件可被 patch 命令应用
小技巧:快速判断是否完全相同
除了 cmp,还可以用校验和,但要注意适用场景:
- cmp -s a b && echo “same” —— 零开销、最准确的全等判断
- sha256sum a b | awk ‘{print $1}’ | sort -u | wc -l —— 若输出为 1,说明哈希一致(但存在极小碰撞可能,且需计算整个文件)
- diff 对空文件或超大文件响应更快(可提前终止),cmp 在首字节就不同情况下也极快






























