- 博客(2)
- 收藏
- 关注
原创 python爬虫中文乱码问题
爬取网站,内容中的中文出现乱码,处理过程中的2个问题: 1、内容乱码,解析错误造成,首先要找到网页的正确编码,通过3条命令: print(res.encoding) print(res.apparent_encoding) print(requests.utils.get_encodings_from_content(res.text)) 输出结果: ISO-8859-1 GB2312 ['gb2312'] 说明默认的解析“ISO-8859-1”不正确,应该用GB2312解码。 2、GB2312解码过程中
2021-01-14 10:34:18
223
原创 第一篇博客
如何获取积分 据说写博客就可以获得10积分,我来看看是不是这么简单就可以了。 这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰...
2019-02-28 17:12:43
87
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人