在写python爬虫的时候,听说处理Unicode字符串是比较痛苦的(但是我还没感受过!),
先把解决问题贴上来,以后肯定会遇到的:
解决的方法就是最好一开始就让你的数据库支持Unicode编码:
ALTER DATABASE scraping CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
ALTER TABLE pages CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
ALTER TABLE pages CHANGE title title VARCHAR(