SQL前缀索引使用场景_前缀索引设计思路

18次阅读

前缀索引适用于长字符串字段且前缀选择性高的场景，如邮箱、url、uuid；需通过 count(distinct left()) 实测选择性，目标 >90%；不支持 order by/group by、唯一约束受限，like 仅前缀匹配有效。

SQL 前缀索引使用场景_前缀索引设计思路

前缀索引适用于字段值较长、但前几位就具备足够区分度的场景，比如邮箱、URL、用户名等字符串列。它能减少索引体积、提升写入和缓存效率，但会牺牲部分查询精度和排序能力。

核心判断标准是：字段值长度大 + 前缀选择性高（即前 N 个字符就能较好区分不同记录）。

不能拍脑袋定，要基于数据分布实测选择性：

先查字段总行数：SELECT COUNT(*) FROM t;
再按不同前缀长度统计去重数，例如：
SELECT COUNT(DISTINCT LEFT(email, 10)) AS cnt10, COUNT(DISTINCT LEFT(email, 15)) AS cnt15 FROM t;
计算选择性 = 去重数 / 总行数；目标是达到 90%+，且长度尽量小
可配合直方图或采样分析，避免全表扫描代价过高

它不是万能替代方案，有明确限制：

当前缀索引局限明显时，可考虑这些更稳健的做法：

生成列 + 普通索引 ：MySQL 5.7+ 支持，如为 email 创建虚拟列 email_prefix VARCHAR(16) STORED AS (LEFT(email,16))，再对其建索引
哈希列索引 ：对长字段计算 MD5/SUBSTR(MD5(),1,16)，存为新列并建索引，适合等值查询，但丧失范围能力
全文索引（FULLTEXT）：针对搜索类场景，但只适用于 MyISAM 或 InnoDB 的 TEXT/VARCHAR 列
业务层截断 + 校验 ：如邮箱登录时只比对前缀，后端再全量校验，平衡性能与准确性

发表于：数据库

2026-03-03