SQL WHERE 条件组合优化技巧

12次阅读

最常见的问题是结果错误而非性能差,因 and 优先级高于 or,未加括号时 where a=1 or b=2 and c= 3 等价于 a =1 or (b=2 and c=3);应显式加括号或用 in 替代多 or,避免函数作用于索引字段。

SQL WHERE 条件组合优化技巧

WHERE 中 AND 和 OR 混用导致逻辑错乱

最常见的问题不是性能差,而是结果不对——AND 优先级高于 OR,没加括号时,WHERE a = 1 OR b = 2 AND c = 3 实际等价于 WHERE a = 1 OR (b = 2 AND c = 3),而不是你直觉想表达的 (a = 1 OR b = 2) AND c = 3

实操建议:

  • 所有含 OR 的组合,只要不是最外层单条件,一律用括号显式包裹,比如 WHERE (status = 'active' OR status = 'pending') AND created_at > '2024-01-01'
  • IN 替代多个 OR 等值判断,语义清晰且多数引擎能更好优化:WHERE status IN ('active', 'pending')
  • 避免在 OR 左右两侧混用不同字段的范围查询(如 date > '2024' OR amount > 1000),这类组合几乎无法走索引,后续会单独讲

带函数或计算的 WHERE 条件让索引失效

WHERE UPPER(name) = 'JOHN'WHERE DATE(created_at) = '2024-01-01',哪怕 namecreated_at 有索引,也基本白搭。数据库没法用索引去匹配“先算一遍再比”的值。

实操建议:

  • 把函数移到右侧:用 WHERE name = UPPER('john')(注意大小写一致性)或 WHERE created_at >= '2024-01-01' AND created_at
  • 对固定模式做函数索引(PostgreSQL/MySQL 8.0+ 支持):CREATE INDEX idx_upper_name ON users (UPPER(name)),但只在明确总是按该方式查询时才建
  • 时间字段慎用 YEAR()HOUR() 等提取函数,它们强制全表扫描;改用范围比较更可靠

NULL 值参与比较引发意外空结果

WHERE column = NULL 永远不返回任何行,因为 SQL 中 NULL = NULL 是未知(UNKNOWN),不是真;同理 != NULL> NULL 全部无效。

实操建议:

  • 判空必须用 IS NULLIS NOT NULL,这是唯一标准写法
  • 需要把 NULL 当作某个具体值参与逻辑时,用 COALESCE(column, 'default')NULLIF() 显式转换,但注意这又可能让索引失效
  • 联表查询中,ON 条件若含可能为 NULL 的字段(比如 LEFT JOIN 右表字段),别直接在 WHERE 里写 right_table.id != 5,它会把 NULL 行过滤掉;应写成 right_table.id IS NULL OR right_table.id != 5

IN 列表过长拖慢执行甚至超限

MySQL 默认 max_allowed_packet 限制单条语句长度,PostgreSQL 对 IN 元素数量无硬限制但解析 / 计划耗时明显上升。传 5000 个 ID 进 IN,可能卡在语法分析阶段,或者生成极低效的执行计划。

实操建议:

  • 超过几百个值就别硬塞 IN,改用临时表 + JOIN:先 CREATE TEMP TABLE tmp_ids (id INT),批量插入,再 SELECT * FROM orders JOIN tmp_ids ON orders.user_id = tmp_ids.id
  • 如果只是前端分页查“某批 ID”,考虑用 VALUES 表达式(PostgreSQL)或 UNION ALL 构造集(兼容性更好)
  • MySQL 用户注意:IN 列表中含子查询(如 IN (SELECT id FROM ……))时,5.7+ 会尝试物化,但复杂嵌套仍易退化;优先拆成两步

真正难的不是写对 WHERE,而是想清楚数据分布和索引覆盖是否匹配你的条件顺序——比如 WHERE deleted = 0 AND tenant_id = 123 AND status = 'done',如果 deleted 列只有两个值,放最前反而可能阻碍索引选择,这时候就得看实际 EXPLAIN 结果,而不是背口诀。

text=ZqhQzanResources