前两天一个香港的项目中出现一个错误:在把这个字“𠝹”存进MySQL中时候出现错误:
Incorrect string value '\xF0\xA0\x9D\xB9\xE5\x82...' for column 'CONTENT' at row 1
香港的同事查找了资料说现在项目中的mysql只是支持3byte的utf8,不支持4byte的utf8,但是这个字却是属于
4byte的,所以就出错,然后需要我帮忙找解决方法。
在网上找了不少资料,最后在这篇文章中找到答案了:MYSQL中的COLLATE是什么?
原因是:mysql中有utf8和utf8mb4两种编码,在mysql中请大家忘记utf8,永远使用utf8mb4。这是mysql的一个遗留问题,mysql中的utf8最多只能支持3bytes长度的字符编码,对于一些需要占据4bytes的文字,mysql的utf8就不支持了,要使用utf8mb4才行。
我在HeidiSQL中修改了相关的表的字段的COLLATE为utf8mb4_general_ci,然后再次存入这个字就可以,咩有报错了。
但是在Linux上使用命令行修改COLLATE的时候却没有成功,原因还不清楚,然后想到可以先把整个表的结构和数据导出,然后修改表的CHARSET为utf8mb4,修改COLLATE为utf8mb4_general_ci,这样子做应该是可以成功的,不过还没尝试,尝试后我再在这里更新结果。