python requests 详细学习content 和text 的区别

最新推荐文章于 2025-07-17 16:47:05 发布

katios

最新推荐文章于 2025-07-17 16:47:05 发布

阅读量9.1k

点赞数

CC 4.0 BY-SA版权

分类专栏： python requests 文章标签： python requests

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_21302587/article/details/73441599

python 同时被 2 个专栏收录

46 篇文章

订阅专栏

1 篇文章

订阅专栏

本文探讨了Python requests库中response对象的content与text属性的区别。content返回未经解码的字节串，适用于所有编码；而text则返回解码后的Unicode字符串，默认采用ISO-8859-1编码，可能造成中文乱码。文章通过实例展示了如何通过设置正确的编码来避免乱码问题。

之前使用requests 不求甚解，一直使用content输出文本。阅读文档后记录如下：

import requests
r=requests.get('http://www.baidu.com')
print r.content
print r.text

你会发现，content输出的文本没问题，但是text输出的文本貌似是乱码。

深究下，我们使用

print type(r.content)
print type(r.text)

content 输出类型为 str
text 输出类型为 unicode

使用
print r.encoding

输出 ISO-8859-1 编码

属于单字节编码，最多能表示的字符范围是0-255，应用于英文系列。比如，字母’a’的编码为0x61=97。

很明显，iso8859-1编码表示的字符范围很窄，无法表示中文字符。

我们通过指定编码

r.encoding='utf-8'
print r.text

此时，刚刚的乱码已经可以正确显示了。

至此，我们大致可以说

content返回的是str 类型，就是我们眼睛所看到的内容，被浏览器渲染过。
text返回的是unicode 类型，可能是返回的最原始的数据，可以理解为尚未渲染过。

不同看法欢迎大家留言讨论

博客等级

码龄11年

147
原创

232
点赞

449
收藏

90
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: python csv模块使用

下一篇：: python 字典中取值的两种方法

最新评论

win10 无法拨号上网720错误
GeorgeHu6: win11还是有这个问题，亲测有用
python 字典中取值的两种方法
Flynn1392: print的写法还是python2的
win10 无法拨号上网720错误
REACH THE PEAK499: 确实好像是
linux 下对汉字删除需要delete两次的问题
️是纱雾酱哟～: 我目前使用的是 Ubuntu 22.04 LTS on WSL2 ，Shell 使用的是 Fish ，终端是 Windows Terminal Preview。按照博文修改了 ~/.config/fish/config.fish 并配置了环境变量 $LC_ALL 和 $LANG 为 "zh_CN.UTF-8" ，确实变成了简体中文环境，且 Fish Shell 的光标可以正常识别汉字并删除的。但是在使用 cat 命令和运行 C/C++/Java/Python 程序的时候，汉字输入依旧需要3次 Backspace 才能删除。这个有什么比较好的解决方案嘛？
python 字典中取值的两种方法
厉害的大炮: 格式不规范，后面应该添加空格

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。