静态文件缓存本质是绕过 PHP 直接由 Web 服务器返回预生成的 HTML 文件,关键在于 Nginx 在 PHP 执行前通过 try_files 和 rewrite 接管请求;需校验路径安全、隔离缓存目录、规范缓存键、同步删除失效文件。

静态文件缓存的本质是「绕过 PHP 执行」
动态内容生成后写入 .html 或 .php 文件,后续请求直接由 Web 服务器(如 Nginx/Apache)返回该文件,不经过 PHP 解析器。这意味着:只要缓存文件存在且未过期,index.php 根本不会被加载——性能提升来自进程层面的跳过,不是代码优化。
关键判断点: 你是否真的需要“静态化”? 如果页面仅部分变动(比如用户登录态、实时时间)、或更新频率高(秒级)、或 URL 参数多(?id=123&sort=desc),用纯静态文件缓存反而会引入失效逻辑复杂、磁盘 I/O 激增、SEO 路径爆炸等问题。
file_put_contents() 写缓存前必须做路径安全校验
常见错误是把用户可控参数(如 $_GET['id'])拼进缓存路径,导致写入任意位置:/var/www/cache/../../etc/passwd。PHP 不会自动过滤 ..,file_put_contents() 会照单全收。
- 用
basename()提取合法文件名,丢弃路径遍历字符:$cache_file = '/cache/' . basename($_GET['id']) . '.html'; - 缓存目录必须与 Web 根目录隔离(如放在
/var/tmp/myapp_cache/),禁止放在public_html下可被直接访问的路径 - 写入前检查父目录是否存在且可写:
is_writable(dirname($cache_file)) === false就中止 - 避免用
md5()或sha1()做缓存键——它们不防碰撞,且无法反查原始 URL;优先用规范化后的 URL 路径哈希(如md5(parse_url($url, PHP_URL_PATH) . '?' . http_build_query($params)))
Nginx 配置要接管静态缓存命中逻辑
光靠 PHP 写文件没用。如果请求仍走 index.php 入口,缓存就形同虚设。Nginx 必须在 PHP 执行前检查对应静态文件是否存在。
立即学习 “PHP 免费学习笔记(深入)”;
典型配置片段(放在 server 块内):
location / {try_files $uri @php;} location @php {# 检查 HTML 缓存是否存在 if (-f $document_root/cache/$uri.html) {rewrite ^(.*)$ /cache/$1.html break; } fastcgi_pass php-fpm; include fastcgi.conf; }
注意:$uri 是不含查询参数的路径,所以 /article/123 对应缓存文件是 /cache/article/123.html;带参数的 URL(如 /search?q=php)需额外处理,否则永远不命中。
缓存失效比生成更难处理
静态文件不会自己更新。一旦源数据变更(如文章被编辑),旧缓存必须立即删除或覆盖,否则用户看到脏数据。
- 不要依赖「过期时间」:用
filemtime()判断缓存是否过期,但 PHP 读文件仍是 IO,不如直接删文件 - 更新数据时同步
unlink()对应缓存文件,而不是等它过期——这是最可靠的方式 - 批量失效场景(如分类下所有文章更新),缓存路径设计要支持通配符删除(如用目录分组:
/cache/category/tech/*.html),避免全站rm -rf - 并发写入风险:多个请求同时发现缓存不存在,都去生成,造成重复写。加
flock()或用原子性file_put_contents($file, $content, LOCK_EX)
真正的难点不在怎么存,而在于「谁来删、什么时候删、删哪些」——这部分逻辑往往比业务代码还重,且容易被忽略。






























