- 博客(37)
- 收藏
- 关注
原创 python爬虫之爬虫入门
此时利用r.apparent_encoding获取页面内容编码后将内容方式赋值给encoding后再次查看页面内容时则能正确解读后;所以当使用encoding不能正确解码内容时,我们就使用apparent_encoding。r.encoding是从HTTP头部信息中的charset中获取的,当header中不存在charset时,则认为编码为“ISO-8859-1”r.apparent_encoding则是从网页内容中分析出的编码形式。所以当我们利用r.text查看网页内容时,可看到返回是乱码的。
2024-03-20 15:55:17 885
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人