【异步爬虫】【aiohttp】不需要手动指定aiohttp中的encoding编码

博客探讨了在使用requests库和aiohttp库进行HTTP请求时,如何处理响应的编码问题。在requests中,需要手动设置响应的encoding,而aiohttp库的response.text()方法会自动根据网页charset进行编码,若未指定则默认为UTF-8。文章通过源码分析解释了这一差异,并提供了指定编码的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在使用requests库通过get方法请求网页时,得到的response结果需要手动调整encoding属性,不然会出现乱码。

但是使用异步aiohttp的get方法时,得到的response不需要手动调整encoding,因为response.text()得到的内容是默认会按照网页的charset去编码,请看代码:

  • 下图是调用aiohttp中的get()方法的代码:
    示例代码

  • 我们来看一下response.text()的源码:
    源码

  • 继续看self.get_encoding()的源码:
    在这里插入图片描述

可以看到,如果没有指定encoding,会默认获取网页的charset属性,获取不到,会设置默认值UTF-8,所以并不需要手动指定,当然你想指定也无可厚非,做法是:response.text(encoding=response.charset)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值