Python爬虫笔记——分析AJAX传递的JSON获取数据-初步分析动态网页

最新推荐文章于 2022-12-06 09:45:54 发布

Fo*(Bi)

最新推荐文章于 2022-12-06 09:45:54 发布

阅读量389

点赞数

分类专栏：爬虫笔记文章标签： python ajax

本文链接：https://blog.csdn.net/weixin_48615832/article/details/107928777

版权

爬虫笔记专栏收录该内容

37 篇文章 4 订阅

订阅专栏

转载文章链接：
Python爬虫：分析AJAX传递的JSON获取数据-初步分析动态网页（1）
【4】实战：爬取动态网页的两种思路爬取新浪趣图（1）
【5】实战：爬取动态网页的两种思路爬取新浪趣图（2）

import json
from jsonpath import jsonpath #从jsonpath库中导入jsonpath方法
json_str='{"content":'+response.text[19:-1]+'}' #即将我们刚才分析出的结果进行格式化
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串，还有一个dumps()方法是将python对象转换成json字符串，其中的转换之间的关系不再赘述，有兴趣自行查阅相关资料

【改进】：
上面的json_str的取出元祖中的字典字符串时，完全可以使用正则表达式：

import json
import re
json_str=re.findall(r'\((.*?)\)',response.text)[0] #即将我们刚才分析出的结果进行格式化  \(匹配任意的括号。
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串，还有一个dumps()方法是将python对象转换成json字符串，其中的转换之间的关系不再赘述，有兴趣自行查阅相关资料

Fo*(Bi)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫笔记——分析AJAX传递的JSON获取数据-初步分析动态网页

转载文章链接：Python爬虫：分析AJAX传递的JSON获取数据-初步分析动态网页（1）【4】实战：爬取动态网页的两种思路爬取新浪趣图（1）【5】实战：爬取动态网页的两种思路爬取新浪趣图（2）
复制链接

扫一扫

专栏目录