python往Mysql数据库中插入数据存在这个汉字时出错
pymysql.err.InternalError_ (1366, Incorrect string value ‘__xF0__xA4__x9F__xA5’ for column
问题原因
mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。
任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字,以及任何新增的 Unicode 字符等等(utf8的缺点)。
“𤟥”属于不常用的汉字,它的长度为四字节。
解决方法
python代码中 charset=‘utf8mb4’
conn = pymysql.connect(host='127.0.0.1', user='root', password='secret', db='daddy_words', port=3306, charset='utf8mb4')
数据库修改字符集
ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4;