通过requests模块获取内容乱码。如下:
首先查看当前网页使用什么编码。包含chardet模块。
import chardet
若要查询的网页内容为r.content
print (chardet.detect(r.content))
输出结果为:
由此可知该页面使用的是GB2312编码。于是使用GB2312解码。
print (r.content.decode('GB2312'))
此时输出就没有乱码了。
通过requests模块获取内容乱码。如下:
首先查看当前网页使用什么编码。包含chardet模块。
import chardet
若要查询的网页内容为r.content
print (chardet.detect(r.content))
输出结果为:
由此可知该页面使用的是GB2312编码。于是使用GB2312解码。
print (r.content.decode('GB2312'))
此时输出就没有乱码了。