python requests text content_python requests的content和text方法的区别【转】

这篇博客介绍了requests库中GET和POST方法返回的Response对象,.content存储字节码,.text则尝试解码为字符串。.text可能因编码问题导致乱码,此时需用.content.decode('编码方式')。建议一般使用.text,若出现乱码问题,则需手动解码。
摘要由CSDN通过智能技术生成

requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应状态码等。其中返回的网页部分会存在.content和.text两个对象中。

两者区别在于,content中间存的是字节码,而text中存的是Beautifulsoup根据猜测的编码方式将content内容编码成字符串。

直接输出content,会发现前面存在b'这样的标志,这是字节字符串的标志,而text是,没有前面的b,对于纯ascii码,这两个可以说一模一样,对于其他的文字,需要正确编码才能正常显示。大部分情况建议使用.text,因为显示的是汉字,但有时会显示乱码,这时需要用.content.decode('utf-8'),中文常用utf-8和GBK,GB2312等。这样可以手工选择文字编码方式。

所以简而言之,.text是现成的字符串,.content还要编码,但是.text不是所有时候显示都正常,这是就需要用.content进行手动编码。

eg:text

a8ef6ec40ef66d8734a225ec03a95882.png

输出的结果为:

遇到中文时就会显示乱码

7313692d61d4ee329a4e3615ddf17844.png

这样不是我们想要的结果了

那么这个时候就只能用content的方法来实现解码了

eg:content

89b2e85902e217c59b6841890065d673.png

结果是:

20bba7c75560ac279e0e7adefd34e1a5.png

这个时候不过都是16进制的东西,这个没有关系再进行encode('utf-8')对应的解码就可以了

解决方案:进行encode('utf-8')对应的解码就可以了

4dd09ded3b88f34dea50b641b0d9cbc3.png

结果:

f8b295b200414fc2d17ceb3b830c3cb3.png

这样就可以显示你想要的结果了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值