python request.get乱码_python的request中文乱码怎么办

weixin_39683021

于 2021-01-28 18:25:48 发布

阅读量610

点赞数

文章标签： python request.get乱码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39683021/article/details/113493484

版权

先在爬虫都在推荐用Requests库，而不是Urllib，但是读取网页的时候中文会出现乱码。

分析：

r = requests.get(“http://www.baidu.com“)

**r.text返回的是Unicode型的数据。

使用r.content返回的是bytes型的数据。

也就是说，如果你想取文本，可以通过r.text。

如果想取图片，文件，则可以通过r.content。**

获取一个网页的内容

方法1：使用r.content，得到的是bytes型，再转为strurl='http://music.baidu.com'

r = requests.get(url)

html=r.content

html_doc=str(html,'utf-8') #html_doc=html.decode("utf-8","ignore")

print(html_doc)

方法2：使用r.text

Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。请求发出后，Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 r.text 之时，Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码，并且能够使用 r.encoding 属性来改变它.

但是Requests库的自身编码为: r.encoding = ‘ISO-8859-1’

可以 r.encoding 修改编码url='http://music.baidu.com'

r=requests.get(url)

r.encoding='utf-8'

print(r.text)

weixin_39683021

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python request.get乱码_python的request中文乱码怎么办

先在爬虫都在推荐用Requests库，而不是Urllib，但是读取网页的时候中文会出现乱码。分析：r = requests.get(“http://www.baidu.com“)**r.text返回的是Unicode型的数据。使用r.content返回的是bytes型的数据。也就是说，如果你想取文本，可以通过r.text。如果想取图片，文件，则可以通过r.content。**获取一个网页的内容方法...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。