数据库的字符集和排序规则优先级:字段级别>表级别>schema级别>服务器级别(实例级别),如果没有设置字段级别的字符集和排序规则,那么默认就取表的,如果表上也没有设置那就默认取schema上的字符集和排序规则,一般来说schema上肯定是配置了的(必须要配置,否则会取默认的字符集和排序规则),实例级别的字符集和排序规则一般用不到。
如果要修改排序规则,那么至少要把一个表的所有字段和表的排序规则一起修改,否则就是在埋雷。一个表的字段用不一样的字符集和排序规则会导致混乱。
修改表的排序规则之前要先修改字段的排序规则,修改方式就是生成批量改字段属性的sql:
SELECT
CONCAT('ALTER TABLE `', table_name, '` MODIFY `', column_name, '` ', DATA_TYPE,
'(', CHARACTER_MAXIMUM_LENGTH, ') CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci',
(CASE WHEN IS_NULLABLE = 'NO' THEN ' NOT NULL' ELSE '' END),
(case when IFNULL(column_comment,'')='' then '' else concat(' COMMENT \'' , column_comment ,'\'') end),
';') as `sql`
FROM information_schema.COLUMNS
WHERE 1=1
and TABLE_SCHEMA = 'data_assets' #要修改的数据库名称
and COLLATION_NAME!='utf8mb4_unicode_ci' #被改的编码
然后再修改表的排序规则。
修改字段排序规则修改字段属性,对大表来说非常慢,即使是不大的表,因为字段很多,也会对读写产生非常大的影响,会产生MDL(元数据锁),阻塞所有的读写,所以每一次修改都需要经过详细评估影响。