关于用Requests模块页面编码的相关

利用Requests模块获取到目标页面后,先观察该页面的编码:

req = requests.request('GET', url)
print req.encoding

当这个编码与你的IDE的编码相同的时候,才不会乱码。

一般文件都是utf8的格式。

我的PyCharm是encoding设置的是utf8格式,所以当我请求百度首页后,返回的页面可以直接通过req.text显示,无乱码。

而我然后又请求了一个页面,该页面的encoding是ISO-8859-1的,所以显示乱码,这时候要使得页面的编码符合你IDE的编码格式,所以修改页面的编码为utf-8才能不乱码:

req.encoding='utf-8'

然后再:
print req.text
才不是乱码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值