当爬取网页内容为乱码时,解决办法
当爬取网页内容为乱码时,解决办法r.apparent_encoding 从内容中分析响应内容的编码方式encoding和apparent_encoding的区别r.encoding:如果header中不存在charset,则认为编码为ISO-8859-1r.apparent_encoding:根据网页内容分析出的编码方式r.apparent_encoding比r.encoding更为准确如爬取 https://www.dxsbb.com/news/44368.htmlimport
原创
2020-11-24 17:26:00 ·
1037 阅读 ·
1 评论