python网络爬虫-数据存储中如何改变mysql数据库的字符为unicode

      在进行网络数据采集时,处理Unicode字符串是很痛苦的事情。默认情况下,MySQL也不支持Unicode字符处理。不过你可以设置这个功能(但是这样做会增加数据库的占用空间)。因为在维基百科上我们难免会遇到各种各样的字符,所以最好一开始就让你的数据库支持Unicode。如何修改数据库的支持的字符集。

ALTER DATABASE scrapying CHARACTER SET utf8mb4 COLLATE  utf8mb4_unicode_ci;
ALTER TABLE pages CHARACTER SET utf8mb4 COLLATE   utf8mb4_unicode_ci;
ALTER TABLE pages CHANGE title title VARCHAR(200) CHARACTER SET utf8mb4 COLLATE   utf8mb4_unicode_ci;
ALTER TABLE pages CHANGE content content VARCHAR(10000) CHARACTER SET utf8mb4 COLLATE  utf8mb4_unicode_ci;
    这四行语句改变的内容有:数据库、数据表、以及两个字段的默认编码都从utf8mb4转变成utf8mb4_unicode_ci。执行结果和步骤如下:


现在字符已经转换完成,插入一个中文试试。

insert into pages(title,content) values('火影忍者','佐助鸣人啦啦啦啦啦')
查询插入的结果,显示如下:


中文显示正常,字符切换成功


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值