在将中文维基数据导入到本地mysql过程中 可能出现下面的错误:
:1366:Incorrect string value: '\xF0\xA3\xAD\x96\xEF\xBC ... for column ‘XXX’ at row 1
原因有二:
1. 仔细核查是因为插入的中文有异体字下面这个异体字,默认的utf8是3个字节的,而这个异体字是4个字节,因此一插入就出错。http://jwdsk.cn/post-151.html
2. 有可能文字中存在表情。。。https://www.cnblogs.com/h--d/p/5712490.html
解决措施 采用 utf8mb4 字符集
也可能在创建表格时候有问题 ,在CREATE语句分号前面加上这么一句:charset utf8 collate utf8_general_ci https://www.cnblogs.com/huzi007/p/5659361.html
再次出现错误...ERROR 1406 (22001) at line 6833: Data too long for column 'rev_comment' at row 911
解决措施:
Switch the MySQL mode to not use STRICT. 在sql里面输入:SET @@global.sql_mode= 'NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';
2. You can run an SQL query within your database management tool, such as phpMyAdmin: SET @@global.sql_mode= '';\
但是感觉第二种是短暂的啊。。。
https://stackoverflow.com/questions/18897420/data-too-long-for-column-why
https://stackoverflow.com/questions/15949038/error-code-1406-data-too-long-for-column-mysql
好的第三次出错 但这次终于快完了。。。
ERROR 1062 (23000) at line 19875: Duplicate entry '4-知识问答' for key 'name_title'
去网上稍微找了一点资料 并不知道是什么原因啊 最后决定把这一行直接删掉算了...
好的手贱删掉了数据库... 然后去网上找到了一种提高性能的方法
即如这篇 http://blog.csdn.net/qq_29164095/article/details/78905680 打开初始化文件 然后添加 这一行 应该会重写的 innodb_log_file_size = 512M
据说可以大大提升性能