collations默认排序规则的坑

问题现象

使用mysqldump从Mysql 5.7迁移到Mysql 8.0。

迁移前:5.7上字符集为utf8mb4,排序规则为utf8mb4_general_ci

迁移后: 8.0上字符集为utf8mb4,排序规则自动变成了utf8mb4_0900_ai_ci(期望general_ci)

不同排序规则关联会产生报错

在这里插入图片描述

原因说明:

https://dev.mysql.com/doc/refman/8.0/en/charset-mysql.html

在这里插入图片描述

1、每个字符集有一个默认的排序规则,在mysql5.7,utf8mb4的默认排序规则为utf8mb4_general_ci,在mysql8.0,utf8mb4的默认排序规则为utf8mb4_0900_ai_ci。

2、在建表的时候若没有显式指定排序规则,则自动使用字符集的默认排序规则。

建表测试

测试环境: mysql 8.0
### DEFAULT CHARSET=utf8mb4


DB级别字符集设置
CREATE DATABASE `bakdata` /*!40100 DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci */ /*!80016 DEFAULT ENCRYPTION='N' */


执行语句:
CREATE TABLE `wjf_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`app_name` varchar(64) NOT NULL COMMENT '执行器AppName'
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4;


实际生效语句
CREATE TABLE `wjf_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`app_name` varchar(64) NOT NULL COMMENT '执行器AppName'
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;


执行语句:
CREATE TABLE `wjf_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`app_name` varchar(64) NOT NULL COMMENT '执行器AppName'
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB ;


实际生效语句:
CREATE TABLE `wjf_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`app_name` varchar(64) NOT NULL COMMENT '执行器AppName'
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

执行语句:
CREATE TABLE `wjf_test` (
  `id` int NOT NULL AUTO_INCREMENT,
  `app_name` varchar(64) COLLATE utf8mb4_general_ci NOT NULL COMMENT '执行器AppName',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT COLLATE=utf8_bin;


实际生效语句:
CREATE TABLE `wjf_test` (
  `id` int NOT NULL AUTO_INCREMENT,
  `app_name` varchar(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT '执行器AppName'
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 COLLATE=utf8_bin

测试结论:

表级别字符集生效规则:

CHARSETCOLLATE实际生效说明
库级别设置库级别设置生效
COLLATE为COLLATE的默认排序规则库级别不生效,特别注意,mysql 8 中utf8mb4的默认collate为utf8mb4_0900_ai_ci
CHARSET为COLLATE对应的字符集库级别不生效,每个collate存在唯一对应的charset
表级别设置

字符集修改

alter table_name CONVERT TO CHARACTER set utf8mb4 collate utf8mb4_general_ci;

1、该语句会同时修改表级别的设置和已存在的数据。

2、该操作会锁表(排他MDL锁),阻塞DML。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值