python用requests模块时，调用text方法出现中文乱码的解决办法

最新推荐文章于 2022-09-02 23:19:30 发布

chishenhe2057

最新推荐文章于 2022-09-02 23:19:30 发布

阅读量254

点赞数

文章标签： python

原文链接：https://my.oschina.net/wubiao239/blog/869644

版权

python用requests模块时，调用text方法出现中文乱码的解决办法

import requests
r = requests.get('http://blog.sina.com.cn/weekdawn')
print r.text

这样直接运行后，会报错:

UnicodeEncodeError: 'gbk' codec can't encode character u'\xe6' in position 260: illegal multibyte sequence

然后我加了一行代码查看原因：

r.encoding

运行后，显示的编码为：

ISO-8859-1

很奇怪对不对，不过既然知道原因了就不用在意这种细节，只需要在调用text方法之前，修改一下编码即可，如下：

import requests

r = requests.get('http://blog.sina.com.cn/weekdawn')

r.encoding = 'utf-8' #这里添加一行

print r.text

转载于:https://my.oschina.net/wubiao239/blog/869644

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chishenhe2057

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python网络通信时出现乱码_python的request中文乱码怎么办

weixin_39785858的博客

11-24

关于Python的requests中text中文乱码的问题

qq_36215993的博客

11-21

4127

今天学习python爬虫是遇到了字符编码的问题 target = 'http://www.biqukan.com/1_1094/5403177.html' req = requests.get(url=target) print req.text 打印出来的中文都是乱码，现在说一下解决方案。首先要明确的是，req.text返回的是unicode，也就是说无法再decode，所以网上那些先dec...

参与评论您还未登录，请先登录后发表或查看评论

来自于一篇【关于Python的requests中text中文乱码的问题】的思考?

我先测了

06-08

1410

没关系，作者也不懂！但是很奇怪，明明得知自己访问的网站编码格式是utf-8，为什么输出还是requests自身的编码？所以为了解决上面的问题，不得不通过encoding来改变它：res.encoding='utf-8',这时content正确了，text的问题仍没有解决？背景：使用requests做http协议的接口请求时，对响应结果text的编码问题：出现中文乱码，如何处理中文输出？tips：这里调用编码解码的方法我使用了其自带的默认参数：encoding=utf-8，所以看到的是空括号。

python requests 乱码_Python requests库中文乱码问题

weixin_39926193的博客

12-03

149

当使用requests库的时候，会出现中文乱码的情况分析根据这两篇文章可知：分析requests的源代码发现，text返回的是处理过的Unicode型的数据，而使用content返回的是bytes型的原始数据。也就是说，r.content相对于r.text来说节省了计算资源，content是把内容bytes返回. 而text是decode成Unicode. 如果headers没有charset字符...

Python爬虫-11-response.text出现乱码的解决方案

karry_孙二的博客

05-14

7276

代码如下： # 这里是封装的一个下载url页面的方法 import requests def download_page(url, user_Agent=None, referer=None): print("Downloading:",url) headers = { "Referer":referer, "User-Agent":us...

python 使用 requests 模块发送http请求的方法

09-19

下面是一个使用`requests`模块发送GET请求的例子： ```python import requests url = "https://www.baidu.com" response = requests.get(url) response.encoding = "utf-8" # 设置响应的编码格式，防止乱码 print...

python requests模块及依赖包.zip

06-24

本压缩包包含`requests`模块本身及其依赖包，如`certifi`、`chardet`等，这些都是在进行网络通信时不可或缺的部分。首先，我们来详细了解一下`requests`模块。`requests`提供了一个简洁且一致的API，用于发起HTTP...

Python响应对象text属性乱码解决方案

09-17

通过上述方法，我们可以有效地解决Python响应对象中`text`属性出现乱码的问题。关键在于准确识别网页的编码格式，并采取适当的解码策略。此外，在解码过程中合理地处理非法字符也是十分重要的。在实际应用中，还...

Python解决request请求text中文乱码问题

王世洪的博客

04-14

4967

无意中遇到的问题：发起request请求正常，返回的text里中文部分全部乱码，其他都正常；此处是content-type没有指定默认的编码，response默认是使用iso-8859-1编码对消息进行编码，再传送数据给客户端（大部分网页是有指定编码的）下面的多个解决方案：方法一：自行设置charset # 在html中搜索“charset”，找到编码格式，如此处是：charset="gb2312" prob_res = requests.get('http://www.******

Python request中文乱码问题解决方案

12-16

本篇文章将深入探讨这个问题，以及如何解决Python `requests`库在获取中文网页时的乱码问题。首先，我们需要理解`requests.get()`函数返回的两种类型数据：`r.text`和`r.content`。`r.text`返回的是Unicode类型的...

request，response乱码问题分析及解决总结

doctorvian的博客

04-08

826

刚才回顾以前的项目时，突然发现了这个老朋友，刚入坑时，这个问题可是折磨了我许久，因为刚进公司时，负责一个GBK编码的老项目改造，出现了不少乱码问题，借此机会总结一下，若也能给新入坑的伙伴一丝帮助那就更好了~：）。问题背景 request乱码指的是：浏览器向服务器发送的请求参数中包含中文字符，服务器获取到的请求参数的值是乱码； response乱码指的是：服务器向浏览器发送的数据包含中文字符...

UnicodeEncodeError: 'gbk' codec can't encode character ...

小米的博客

11-21

4万+

使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。网络上有很多类似的文件讲述如何解决这个问题，但是无非就是encode，decode相关的，这是导致该问题出现的真正原因吗？不是的。很多时候，我

解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX

热门推荐

jim7424994的专栏

03-31

24万+

步步为营，解决 UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 8530: illegal multibyte sequence

解决通过python的requests模块获取文本内容出现乱码的问题

m0_55407333的博客

03-01

1742

解决诸如æ´å¤äº§å乱码方案一：在响应对象前加入response.encoding='utf-8'，例如 response.encoding='utf-8' print(response.text) 一般通过以上代码可以解决大部分的乱码。方案二：通过chardet分析二进制响应数据的编码类型，让response.encoding=’求得编码格式‘生效，最后解决乱码问题，例如： import chardet response是响应对象 response.encoding=chardet.

解决Requests中文乱码

chaowanghn的博客

02-06

8万+

python 解决requests中文乱码

jun118166的博客

06-28

1万+

import requests # 爬取阳光电影 html = requests.get("https://www.ygdy8.com/index.html") print(html.text) 运行发现，打印乱码 <a href='/html/gndy/jddy/20160320/50541.html'>IMDBÆÀ·Ö8·Ö×óÓÒÓ°Æ¬400Óà²¿</a><br/> <a href='/html/gndy/jddy/20200627/60172.ht

报错UnicodeEncodeError: ‘gbk’ codec can’t encode character

雪山飞狐

06-12

4105

用Python将网络数据写入本地时，使用open后，报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xef’ in position 25642: illegal multibyte sequence，是因为解码编码不同所导致的。根据这位大神的方法，顺利解决了问题，讲解非常简洁易懂。简言之，就是在代码中加入指定encode：...

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

weixin_44566432的博客

08-10

5962

报错： UnicodeEncodeError:'gbk'codeccan'tencodecharacter'\xf6'inposition156:illegalmultibytesequence 有一次遇到这个编码问题，加上encoding 这个就好了。

解决python将网页保存为text错误，UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u2022‘ in position 0

有问题或资源连接有缺失的可以私信公众号新潮看世界获取

09-02

1825

功能：使用python将网页标签中的text内容下载下来保存为text文件，我用它来下载海贼王漫画的分集标题。一开始使用了open函数，打开txt文件的时候没法设置codec编码，导致保存进去的内容无法匹配对应的编码。后面使用codecs模块的open函数，解决了问题。

令人不悦的Error-UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200b’的解决方法

简说Python的博客

02-23

1万+

简单记录一下今天写代码遇到的一个错误，并附上我的解决方法。问题 UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200b’ 解决方法首先，这个错误是指Unicode编码不能被解析成GBK编码（具体原因是：我的字符串里的这个Unicode编码已经超出了gbk编码的范围）我第一时间想到的方法是把“\u200b”这个字符从我的...