MySQL 字符集配置需统一客户端、连接、服务器、数据库、表、字段六层,推荐全程使用 utf8mb4 和 utf8mb4_unicode_ci;须修改配置文件、建库建表显式指定、同步应用连接层设置,并验证各层级字符集一致。

MySQL 字符集和排序规则配置不当,容易导致 中文乱码、查询结果不一致、索引失效等问题。关键不是只改某一处,而是确保客户端、连接、服务器、数据库、表、字段六个层级的字符集统一协调,尤其推荐全程使用 utf8mb4 和 utf8mb4_unicode_ci(或 utf8mb4_0900_ai_ci,MySQL 8.0+ 默认)。
一、确认当前字符集配置
登录 MySQL 后执行以下命令,查看各层级默认值:
- SHOW VARIABLES LIKE ‘character_set%’; —— 查看服务器、客户端、连接等默认字符集
- SHOW VARIABLES LIKE ‘collation%’; —— 查看对应排序规则
- SHOW CREATE DATABASE db_name; —— 查看库级字符集
- SHOW CREATE TABLE tbl_name; —— 查看表 / 字段级字符集
重点关注 character_set_server、collation_server、character_set_client、character_set_connection、character_set_results 是否一致;若出现 latin1 或 utf8(非 utf8mb4),就存在隐患。
二、修改 MySQL 配置文件(永久生效)
编辑 MySQL 主配置文件(如 /etc/my.cnf 或 /etc/mysql/mysql.conf.d/mysqld.cnf),在 [mysqld] 和 [client] 段落中添加或修改:
- [mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
skip-character-set-client-handshake = ON(可选,强制忽略客户端声明) - [client]
default-character-set = utf8mb4 - [mysql]
default-character-set = utf8mb4
⚠️ 注意:utf8 在 MySQL 中是阉割版(最多 3 字节),不支持 emoji 和部分生僻汉字;必须用 utf8mb4。修改后需重启 MySQL 服务生效。
三、创建数据库和表时显式指定
即使全局配置正确,新建库 / 表仍可能继承旧默认值。建议显式声明:
- 建库:CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
- 建表:CREATE TABLE t1 (id INT, name VARCHAR(100)) CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
- 修改已有表:ALTER TABLE t1 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
对已存数据的表执行 CONVERT TO 会重写全部数据并重建索引,建议在低峰期操作,并提前备份。
四、应用连接层同步设置
仅服务端配置不够,客户端连接也需匹配。常见方式:
- MySQL 命令行连接时加参数:mysql –default-character-set=utf8mb4 -u user -p
- JDBC URL 中添加:?characterEncoding=utf8mb4&serverTimezone=UTC
- PHP mysqli:连接后执行 mysqli_set_charset($conn, ‘utf8mb4’);
- Python PyMySQL:初始化连接时传参 charset=’utf8mb4′
务必验证连接后的变量:SELECT @@character_set_client, @@character_set_connection, @@character_set_results; 三者应均为 utf8mb4。
以上就是如何配置 mysql 字符集和排序规则_mysql 字符集配置指南的详细内容,更多请关注 php 中文网其它相关文章!






























