写的爬虫小项目,爬取贴吧帖子的标题和阅读量,将数据存入MySQL
错误信息:
(1366, "Incorrect string value: '\\xF0\\x9F\\x98\\xAC\\xE3\\x80...' for column 'title' at row 1")
存入错误的数据:
「提问!?」学院附近有什么好ci的嘛
原因:
Mysql里UTF8编码最多只能支持3个字节,而Emoji表情字符使用的UTF8编码,很多都是4个字节,有些甚至是6个字节。
解决:
把要存入的数据库和表的编码及改为utf8mb4
还有python连接数据库的属性也要修改字符集