爬虫——从json类型的Response中获得信息

爬虫——从json类型的Response中获得信息

网址推荐

https://www.json.cn/ 推荐这个网站进行json展开,可以将括号收起,比较方便。

浏览器中response位置

对应的json类型的response 在浏览器中的位置见下图“
在这里插入图片描述
在这里插入图片描述

从json嵌套的字典中提取数据

可以看到,json类型的Response中与字典的结构非常像,需要的评论数据在CommentResult下的CommentInfo中,CommentInfo键所对应的值是一个列表,每个列表元素中存储着一条用户评论的相关信息(以字典方式存储),我们将此列表保存在comment_list中,每个列表元素都是一个字典,然后对每个字典进行操作就可以提取出每条评论的相关数据了。
在这里插入图片描述
在这里插入图片描述

进行json类型数据转换以及信息提取的参考代码

如下是进行json类型数据转换以及信息提取的参考代码,具体代码需要按照不同的网站进行更改。

res = requests.post(postUrl, data=json.dumps(payloadData), headers=headersParameters, timeout=5)

comment_list = []
comment_list = res.json(encoding='utf8')["CommentResult"]["CommentInfo"] //对获取到的response进行格式转换,从json转成字典,然后逐层提取,获取目标信息列表并存储
for comment in comment_list:   //写到文件中
    fw.write(str(comment['TotalStar']) + '\t')
    fw.write(comment['Content'] + '\n')

附注:本文是菜鸟防遗忘笔记。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值