SQL数据库存储层抽象_逻辑结构与物理映射

27次阅读

SQL 数据库存储层抽象的核心是逻辑结构（表、索引等）与物理实现（文件、页、行偏移等）的分离，通过元数据、缓冲池、WAL 和统计信息桥接二者，支撑跨磁盘分布、在线索引、物理备份、优化器决策及跨引擎迁移等关键能力。

SQL 数据库存储层抽象_逻辑结构与物理映射

SQL 数据库的存储层抽象，核心在于把用户看到的表、列、索引等逻辑对象，与磁盘上的文件、页、块、行偏移等物理实现隔离开来。这种分离让开发者专注数据建模，而数据库系统负责高效存取。

逻辑层是 SQL 标准定义的、用户直接操作的部分，不依赖具体存储方式：

物理层由存储引擎实现，将逻辑对象映射为操作系统可管理的资源：

文件（File）：一个数据库通常对应多个文件（如 MySQL 的。ibd、PostgreSQL 的 base 目录下段文件）；文件名常含 OID 或 relfilenode，隐式关联逻辑对象
页（Page / Block）：I/ O 最小单位（常见 16KB 或 8KB）；每页存多行数据或索引节点；页头含校验、LSN、空闲空间指针等元信息
行存储格式：实际按页内偏移存放，可能含 NULL 位图、变长字段偏移数组、事务 ID（如 MVCC 的 xmin/xmax）、行头长度标记等
聚簇与非聚簇：InnoDB 中主键索引即聚簇索引，表数据按主键顺序物理存储；Secondary Index 叶子节点存主键值而非行指针
段（Segment）与区（Extent）：如 SQL Server 或 Oracle 中用于管理空间分配的抽象层，避免碎片化；PostgreSQL 用 FSM（Free Space Map）跟踪页空闲度

数据库通过元数据与运行时结构维持逻辑 - 物理一致性：

系统目录表：如 pg_class（PostgreSQL）、sys.tables（SQL Server）、INFORMATION_SCHEMA.TABLES，记录对象 OID、所属表空间、文件路径、列定义等
缓冲池（Buffer Pool）：内存中页的缓存，通过页号（Page ID）定位物理位置；逻辑查询经解析后转换为对特定页的读写请求
重做日志（Redo Log）与 WAL：保证物理修改的持久性与恢复能力；日志记录的是“在某页某偏移写入某值”，而非 SQL 语句
统计信息：如 pg_statistic 或 MySQL 的 histogram，帮助优化器估算逻辑操作（如 JOIN、FILTER）对应的物理 I / O 代价

它支撑了现代数据库的核心能力：

发表于：数据库

2026-01-06

Python循环性能分析_执行效率解析【教程】

别再搞混了！代币(Token)和代币(Coin)的区别到底是什么