问题:
浏览器支持的编码类型。一般有gzip,deflate,br 等等。
python的requests里,有response.text 和 response.content,一般解码byte和str类型。所以如果遇到br类型就会解码得到一堆乱码。
br是brotli,一种新的数据格式。在网页右键‘检查’,‘Network’里面,可以查看网页的压缩模式:
content-encoding:br
content-type:text/html; charset=utf-8
解决方案:
在python中导入brotli包(安装:pip install brptli):
import brotli
并将‘br’添加到headers的Accept_encoding中:
'Accept-Encoding': 'br,gizp,defale'