python网络通信时出现乱码_python的request中文乱码怎么办

最新推荐文章于 2023-12-19 17:11:08 发布

weixin_39785858

最新推荐文章于 2023-12-19 17:11:08 发布

阅读量73

点赞数

文章标签： python网络通信时出现乱码

本文介绍了在Python中使用Requests库进行网页抓取时，如何处理中文乱码问题。Requests库默认将内容解码为Unicode，可通过r.text获取文本，r.content获取字节数据。当遇到编码问题时，可以设置r.encoding属性来改变解码方式，例如将编码改为'utf-8'，从而正确显示中文内容。

摘要由CSDN通过智能技术生成

先在爬虫都在推荐用Requests库，而不是Urllib，但是读取网页的时候中文会出现乱码。

分析：

r = requests.get(“http://www.baidu.com“)

**r.text返回的是Unicode型的数据。

使用r.content返回的是bytes型的数据。

也就是说，如果你想取文本，可以通过r.text。

如果想取图片，文件，则可以通过r.content。**

获取一个网页的内容

方法1：使用r.content，得到的是bytes型，再转为strurl='http://music.baidu.com'

r = requests.get(url)

html=r.content

html_doc=str(html,'utf-8') #html_doc=html.decode("utf-8","ignore")

print(html_doc)

方法2：使用r.text

Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。请求发出后，Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 r.text 之时，Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码，并且能够使用 r.encoding 属性来改变它.

但是Requests库的自身编码为: r.encoding = ‘ISO-8859-1’

可以 r.encoding 修改编码url='http://music.baidu.com'

r=requests.get(url)

r.encoding='utf-8'

print(r.text)

weixin_39785858

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python网络通信时出现乱码_python的request中文乱码怎么办

先在爬虫都在推荐用Requests库，而不是Urllib，但是读取网页的时候中文会出现乱码。分析：r = requests.get(“http://www.baidu.com“)**r.text返回的是Unicode型的数据。使用r.content返回的是bytes型的数据。也就是说，如果你想取文本，可以通过r.text。如果想取图片，文件，则可以通过r.content。**获取一个网页的内容方法...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。