转载文章链接:
Python爬虫:分析AJAX传递的JSON获取数据-初步分析动态网页(1)
【4】实战:爬取动态网页的两种思路爬取新浪趣图(1)
【5】实战:爬取动态网页的两种思路爬取新浪趣图(2)
import json
from jsonpath import jsonpath #从jsonpath库中导入jsonpath方法
json_str='{"content":'+response.text[19:-1]+'}' #即将我们刚才分析出的结果进行格式化
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串,还有一个dumps()方法是将python对象转换成json字符串,其中的转换之间的关系不再赘述,有兴趣自行查阅相关资料
【改进】:
上面的json_str的取出元祖中的字典字符串时,完全可以使用正则表达式:
import json
import re
json_str=re.findall(r'\((.*?)\)',response.text)[0] #即将我们刚才分析出的结果进行格式化 \(匹配任意的括号。
unicodestr=json.loads(json_str) #json的loads()方法用于将json的字符串转换成python默认的unicode字符串,还有一个dumps()方法是将python对象转换成json字符串,其中的转换之间的关系不再赘述,有兴趣自行查阅相关资料