Python 爬虫中 wad库的‘gbk‘编码问题

Python 爬虫中 wad库的'gbk'编码问题

最近开始学习python的爬虫。
在吕云翔等编写的Python网络爬虫-从入门到精通一书之中,在介绍查看网站所用的技术时,提到了使用wad库的方法。
但我在使用的过程中遇到了如下的问题:
IDLE界面的问题
在这里插入图片描述
在这里插入图片描述
这里先直接给出解决的方法。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
打开到clues.py, 找到第46行,在open函数中增加encoding=‘utf-8’这项参数。之后保存了就可以正常的运行程序了。
在这里插入图片描述

下面是我个人的寻找经历…
首先是去网上直接查、但是关于wad库基本就没有任何的信息。通过提示信息我大概知道是gbk编码的问题,于是又在这方面找了很久,有看到open函数中关于编码参数的讲解,可是因为封装的原因,不知道怎么就着提供的detect等函数来修改相关的编码参数。也尝试过修改系统的默认编码,可是最终发现系统的默认编码就是‘utf-8’.最终只能暴力的去修改库了…
总而言之就是json在打开文件时候的编码问题,因为wad库的相关内容很少,所以我决定还是写一篇博客,看看能不能帮到遇到相同问题的人。

  • 41
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值