Docker镜像基础概念与只读分层文件系统原理

23次阅读

镜像是只读层叠的 tar 包集合，非虚拟机快照；每个 layer 记录文件差分，运行时叠加并挂载可写层；FROM 多次写仅生效最后一个，docker commit 会打包全部可写层导致臃肿。

Docker 镜像基础概念与只读分层文件系统原理

镜像不是虚拟机快照，是只读层叠的 tar 包集合

很多人第一次拉 docker pull ubuntu:22.04 后以为得到了一个“轻量系统”，其实拿到的是一堆按顺序排列的只读 tar 文件（即 layer），每个 layer 记录了文件增删改的差分内容。Docker daemon 用 overlay2（或 aufs、zfs）在运行时把它们叠加起来，再挂一个可写层（container layer）供容器修改。

这意味着：
– 镜像本身从不运行，也不含内核、init 进程或网络栈
– 所有 layer 按顺序叠加，靠后 layer 中同名文件会覆盖前面的
– 你执行 docker history nginx:alpine 看到的每一行，基本对应一个 layer 的构建指令

为什么 `FROM` 多次写不会叠加出新镜像？

因为 Dockerfile 中每个 FROM 都会重置构建上下文：前一个阶段的所有 layer 被丢弃，只保留最终 export 出来的文件（如用 COPY --from=0）。这不是“继承”，而是显式搬运。

常见误操作：
– 在单个 Dockerfile 里写多个 FROM 却没用 --from 引用前一阶段 → 前面的 FROM 完全无效
– 以为 FROM alpine:3.18 + FROM debian:12 会合并两个基础系统 → 实际只生效最后一个 FROM
– 多阶段构建中漏掉 COPY --from=builder /app/binary /usr/local/bin/ → 运行镜像里根本没二进制文件

`docker commit` 生成的镜像为什么总比预期大？

因为 docker commit 会把整个容器可写层打包成一个新 layer，包括所有临时文件、缓存、日志、甚至你 apt install 后没清理的 /var/lib/apt/lists/。它不识别语义，只做快照。

安全且轻量的做法：
– 绝对避免用 commit 生成生产镜像
– 构建必须走 Dockerfile + docker build，让每步都可控、可复现
– 如果真要保存状态（比如调试中装好依赖的环境），先手动清理：rm -rf /var/cache/apk/* /var/lib/apt/lists/* /tmp/*，再 commit
– 注意：commit 不会保留 ENTRYPOINT 或 CMD，得手动加 -c '["/bin/sh"]' 参数指定启动命令

只读层不能改，但为什么 `docker run -v /host:/container` 还能写？

因为 volume 挂载发生在容器启动时，绕过了镜像 layer 叠加逻辑。宿主机路径（/host）和容器内路径（/container）是两个独立的文件系统视图，写操作直接落在宿主机上，跟镜像的只读层完全无关。

关键区别：
– 写 /app/data.txt（在镜像 layer 里）→ 报错或触发 copy-on-write 到可写层（仅限 overlay2 支持）
– 写 /host/data.txt（已用 -v 挂载）→ 直接写宿主机磁盘，镜像层无感知
– tmpfs 类型挂载（--tmpfs /run）也是类似原理：内存文件系统，不经过 layer 栈
– 错误认知：“挂载后就能改基础镜像”→ 实际改的是挂载点，原 layer 依然不可变

最常被忽略的一点：layer 的哈希值由内容决定，哪怕只是多一个空格、换一行，就会生成全新 layer。所以构建缓存失效往往不是因为命令变了，而是某条 RUN 指令的输入（比如 curl 下载的包版本）变了 —— 这种变化无法从 Dockerfile 表面看出。

发表于：互联网运维

2026-03-14

复制链接

Linux 文件查找效率低下的优化方式

Linux 内核在系统运行中承担了哪些核心职责

Linux 用户登录后环境异常的排查思路

Linux shell 脚本编写最佳实践

SQL DISTINCT去重原理_去重查询性能分析

Docker镜像基础概念与只读分层文件系统原理

镜像不是虚拟机快照，是只读层叠的 tar 包集合

为什么 `FROM` 多次写不会叠加出新镜像？

`docker commit` 生成的镜像为什么总比预期大？

只读层不能改，但为什么 `docker run -v /host:/container` 还能写？

亚洲比特币注册链接入口及身份认证教程(2026年最新版)

2026欧易OKX现货交易入口欧易官方App v6.205.0 安卓下载

欧易OKX最新版app安装欧易官方安全获取渠道入口

欧易苹果版iOS官方安装欧易OKX最新获取渠道地址

欧易OKX现货合约官网入口欧易APP官方正版下载安装教程

欧易OKX交易平台2026最新网址入口 OKX官方App安卓最新版本地下载

欧易OKX官网2026最新登录入口 OKX交易所官方安卓APK最新版下载

以太坊官网入口正确打开方式及安全指南

Docker镜像基础概念与只读分层文件系统原理

镜像不是虚拟机快照，是只读层叠的 tar 包集合

为什么 FROM 多次写不会叠加出新镜像？

docker commit 生成的镜像为什么总比预期大？

只读层不能改，但为什么 docker run -v /host:/container 还能写？

为什么 `FROM` 多次写不会叠加出新镜像？

`docker commit` 生成的镜像为什么总比预期大？

只读层不能改，但为什么 `docker run -v /host:/container` 还能写？