今天在爬取网易云音乐歌曲评论的时候,在将数据插入mysql数据库的时候,出现了Incorrect string value: '\xF0\x9F\x98\xAD",...' for column 'commentContent' at row 1 这个错误,Google了下发现原来是因为数据库编码问题导致的,原因在于我们的评论数据中存在emoj表情,而这些表情是按照四个字节一个单位进行编码的,而我们通常使用的utf-8编码在mysql数据库中默认是按照3个字节一个单位进行编码的,正是这个原因导致将数据存入mysql数据库的时候出现错误,那么这个问题我们应该怎么解决呢?
我分为下面三个步骤来解决:
(1):修改mysql数据库的编码为uft8mb4
(2):修改数据表的编码为utf8mb4
(3):修改连接数据库的连接代码
(1):修改mysql数据库的编码为uft8mb4
修改方法:
参看:http://blog.csdn.net/poice00/article/details/52129351
(2):修改数据表的编码为utf8mb4
执行命令:ALTER TABLE TABLE_NAME CONVERT TO CHARACTER SET utf8mb4;
(3):修改连接数据库的连接代码
我原先的数据库连接代码是:
public static final String URL = "jdbc:mysql://localhost:3306/"+DATABASENAME+"?useunicode=true&characterEncoding=utf8";
将其修改成:public static final String URL = "jdbc:mysql://localhost:3306/"+DATABASENAME;