Python爬虫笔记——分析AJAX传递的JSON获取数据-初步分析动态网页

转载文章链接:
Python爬虫:分析AJAX传递的JSON获取数据-初步分析动态网页(1)
【4】实战:爬取动态网页的两种思路爬取新浪趣图(1)
【5】实战:爬取动态网页的两种思路爬取新浪趣图(2)

import json
from jsonpath import jsonpath #从jsonpath库中导入jsonpath方法
json_str='{"content":'+response.text[19:-1]+'}' #即将我们刚才分析出的结果进行格式化
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串,还有一个dumps()方法是将python对象转换成json字符串,其中的转换之间的关系不再赘述,有兴趣自行查阅相关资料

【改进】
上面的json_str的取出元祖中的字典字符串时,完全可以使用正则表达式:

import json
import re
json_str=re.findall(r'\((.*?)\)',response.text)[0] #即将我们刚才分析出的结果进行格式化  \(匹配任意的括号。
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串,还有一个dumps()方法是将python对象转换成json字符串,其中的转换之间的关系不再赘述,有兴趣自行查阅相关资料
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值