在爬取网页的时候经常使用到request库来获取网页的源码
request会根据网页中的编码方式来进行编码,但是有时request获取到的网页中中文出现了乱码,但是查看获取到的编码当时依旧是utf-8的编码。
按照其他的方法来指定编码方式为utf-8后并不能解决这个问题
response = requests.get(url, headers = headers)
response.encoding = 'utf-8'
但是虽然制定了编码方式,但是网页中的中文依旧乱码
查看了一些博客之后,基本上都是将编码方式指定为utf-8的编码,但是问题并没有解决
之后看到可以转换成gbk的编码方式,于是乎,进行尝试,发现的确可以正常的显示、
response = requests.get(url, headers = headers)
response.encoding = 'gbk'