爬虫乱码1
爬取函数
乱码
去掉br即可
br: Google 认为互联网用户的时间是宝贵的,他们的时间不应该消耗在漫长的网页加载中,因此在 2015 年 9 月 Google 推出了无损压缩算法 Brotli。
#解决日期:2019年12月18日
爬虫乱码2
requests.get 中文爬取结果乱码,网站编码为’utf-8’
解决办法:代码更改
page_text = requests.get(url=url, headers=headers)
page_text.encoding = 'utf-8'
print(page_text.text)
#解决日期:2020年5月16日