在练习爬取百度的时候,出现了文字乱码的现象,解决办法:
res.encode = ‘utf-8’
暂且解决办法,不一定适用于所有情况
原理:
requests会基于HTTP头部对相应的编码做出推测,推测出文本编码,不过Request推测出的编码和网站源编码不一定一致,这可能是导致乱码的原因。
在练习爬取百度的时候,出现了文字乱码的现象,解决办法:
res.encode = ‘utf-8’
暂且解决办法,不一定适用于所有情况
原理:
requests会基于HTTP头部对相应的编码做出推测,推测出文本编码,不过Request推测出的编码和网站源编码不一定一致,这可能是导致乱码的原因。