![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
【python爬虫】
文章平均质量分 55
Python爬虫,简单来说,即通过Python程序获取对我们有用的数据。常用于商业分析,不过偶尔也可以辅助我们解决在日常生活中遇到的一些问题。
小七月 搬砖记
人生苦短,及时行乐
展开
-
json.loads解码字符串时出错:JSONDecodeError: Invalid \escape: line 1 column 2687 (char 2686)
一、问题描述在使用爬虫爬取数据时使用json.loads()解码JSON数据时遇到如下错误:1 致错语句: json_data = json.loads(str(star_infos).replace("\'","\"")) 2 错误---------------------------------------------------------------------------JSONDecodeError Traceback (most原创 2021-01-14 00:23:41 · 6392 阅读 · 1 评论 -
爬虫:查找自己浏览器headers
python爬虫: 查找自己浏览器的headers谷歌浏览器中打开任意一个网页——比如打开百度:https://www.baidu.com/在网页中右键单击点击“检查”,出现如下页面。点击最上方选项卡中的‘Network’选项,再按F5,在‘name’框中会出现一个或多个选项,点击任意选项,在右侧点击‘headers’选项,在最下方找到‘User-Agent:’,如下图将User-Agent:粘贴到自己代码headers中即可:headers = { 'User-Agent': 'Mo原创 2021-01-13 20:42:19 · 5440 阅读 · 2 评论