我有一个utf8_general_ci数据库,希望将其转换为utf8_unicode_ci.
我尝试了以下命令
ALTER DATABASE dbname CHARACTER SET utf8 COLLATE utf8_unicode_ci;
ALTER TABLE tbl_name CONVERT TO CHARACTER SET utf8 COLLATE utf8_unicode_ci; (for every single table)
但这似乎会更改将来数据的字符集,但不会将实际的现有数据从utf8_general_ci转换为utf8_unicode_ci.
有什么办法可以将现有数据转换为utf8_unicode_ci?
解决方法:
SHOW CREATE TABLE看看它是否真的在列上设置了CHARACTER SET和COLLATION,而不仅仅是默认值.
ALTERs之前的CHARACTER SET是什么?
对应该包含utf8的某些字段执行SELECT col,HEX(col)….这将帮助我们确定表中是否确实有utf8.字符的编码因CHARACTER SET而异;十六进制有助于发现这种情况.
排序(WHERE,ORDER BY等)由COLLATION控制.可能必须根据您的ALTER TABLE重建索引.具有索引的大表是否需要“很长时间”进行转换?
要真正了解utf8_general_ci和utf8_unicode_ci之间的区别,您需要“合并重音”,或更简单地说,是德语ß与ss:
mysql> SELECT 'ß' = 'ss' COLLATE utf8_general_ci,
'ß' = 'ss' COLLATE utf8_unicode_ci;
+-------------------------------------+-------------------------------------+
| 'ß' = 'ss' COLLATE utf8_general_ci | 'ß' = 'ss' COLLATE utf8_unicode_ci |
+-------------------------------------+-------------------------------------+
| 0 | 1 |
+-------------------------------------+-------------------------------------+
但是,要在表中进行测试,则需要存储这些值,并使用WHERE或GROUP_CONCAT或其他方法确定相等性.
您对ALTER未能完成归类更改有何“证明”?
(解决其他意见:REPAIR应该无关紧要.CONVERT TO告诉ALTER实际修改数据,因此它应该已完成所需的操作.)
标签:character-encoding,mysql
来源: https://codeday.me/bug/20191120/2043001.html