python爬取页面编码格式gb2312中文乱码问题
python爬取页面编码格式gb2312中文乱码问题python小白刚刚学习爬虫,记录一下失败到成功历程~项目场景:爬取某事业单位招聘的数据问题1:通常遇到乱码问题就是爬取一遍,哪里出现乱码修改哪里。比如乱码出现在标题,那么修改标题部分的代码;如下: url = 'http://www.shiyebian.net/fujian/sanming/' page_text = requests.get(url=url,headers=headers).text tree = e
原创
2021-04-28 00:38:37 ·
1464 阅读 ·
2 评论