Linux文件比较方法_diff与cmp使用

5次阅读

diff 用于文本文件行级差异比较,cmp 用于任意文件逐字节比对;前者适合代码配置等场景,后者适用于二进制一致性验证。

Linux 文件比较方法_diff 与 cmp 使用

Linux 中比较文件内容,diffcmp 是最常用的两个命令,但它们用途不同:diff 适合查看文本文件的行级差异,cmp 则用于逐字节比对任意文件(包括二进制),精度更高。

diff:对比文本文件的行变化

diff 默认以“统一格式”(unified diff)输出,清晰标出哪些行被添加、删除或修改。适合代码、配置文件、日志等纯文本场景。

  • 基本用法:diff file1.txt file2.txt —— 显示差异行及上下文
  • 常用选项:-u(统一格式,推荐)、-r(递归比较目录)、-q(仅报告是否不同,不显示详情)
  • 配合 vimdiff 可交互式查看并编辑差异,适合合并修改
  • 注意:diff 会忽略空行、缩进或换行符差异(除非加 -b-w等选项调整敏感度)

cmp:逐字节比对,精准判断二进制是否一致

cmp 不关心文件内容是否“可读”,它把文件当作字节流处理,一旦发现第一个不同字节就停止,默认只报告位置和 ASCII 值。

  • 基本用法:cmp file1.bin file2.bin —— 若相同则无输出;不同则提示首个差异字节的偏移(从 0 开始)和对应字符
  • 常用选项:-l(列出所有不同字节的偏移与值)、-s(静默模式,仅通过退出码判断:0= 相同,1= 不同,2= 错误)
  • 适合验证下载完整性、镜像文件一致性、编译前后二进制是否变化等场景
  • 不能直接看出“逻辑差异”,比如两个 PNG 图片视觉一样但 IDAT 块顺序不同,cmp 仍会报不一致

怎么选?看文件类型和需求

不是“哪个更好”,而是“哪个更合适”:

  • 比对 shell 脚本、JSON、Markdown 等——用diff -u
  • 确认两个 tar 包 /ISO 镜像 / 可执行文件是否完全一致——用cmp -s(配合 if 语句做自动化判断)
  • 想定位二进制中哪几个字节变了——用cmp -l | head
  • 需要可视化合并或打补丁——diff 生成的。patch 文件可被 patch 命令应用

小技巧:快速判断是否完全相同

除了 cmp,还可以用校验和,但要注意适用场景:

  • cmp -s a b && echo “same” —— 零开销、最准确的全等判断
  • sha256sum a b | awk ‘{print $1}’ | sort -u | wc -l —— 若输出为 1,说明哈希一致(但存在极小碰撞可能,且需计算整个文件)
  • diff 对空文件或超大文件响应更快(可提前终止),cmp 在首字节就不同情况下也极快
text=ZqhQzanResources