jsonpath提取王者全英雄名字

在这里插入图片描述

前言

在玩爬虫的时候,总会遇到一些无法通过xpath提取的数据,通常都会存放在JSON格式中,所我这学一下jsonpath。

JSON是什么

可以看看我这篇博客,不过有不全的地方请多多担待,提出来一起学习一起进步!
JSON学习笔记

jsonpath

jsonpath是对JSON格式提取文件的东西,看看这熟悉的path,有没有联想到xpath?差不多,都是用来提取数据的东西

  1. xpath是用于提取HTML和XML的
  2. jsonpath是用于提取JSON格式的

Python中的jsonpath

先安装jsonpath第三方库

pip install jsonpath -i https://pypi.doubanio.com/simple

jsonpath语法

符号描述
$查询的根节点对象,用于表示一个json数据,可以是数组或对象
@过滤器(filter predicate)处理的当前节点对象
*获取所有节点
.获取子节点
递归搜索,筛选所有符合条件的节点
?()过滤器表达式,筛选操作
[start:end]数组片段,区间为[start,end),不包含end
[A]或[A,B]迭代器下标,表示一个或多个数组下标

使用

我们的数据是从王者网站拿的——王者网站
大概就是张这个样子
在这里插入图片描述
然后我们开始联系jsonpath吧

import jsonpath  # 导入jsonpath包
import json  # 导入json包
import requests  # 导入爬虫包

with open("王者英雄.json",'wb') as f:
    f.write(requests.get('https://pvp.qq.com/web201605/js/herolist.json').content)
    # 将json文件保存到本地
with open('王者英雄.json', 'r', encoding="utf-8") as f:
    js = f.read()
    # 读取
c = json.loads(js) # 转成python数据
print(jsonpath.jsonpath(c, '$.*.cname'))  # 使用jsonpath将英雄名字取出来
'''
$.:根目录
*:根目录下所有节点
cname:所有cname元素的值
'''

运行结果:

在这里插入图片描述

结语

拜拜 学习如逆水行舟,不进则退,所以一定要在学习后多加练习~~~~~

那么今天就到这里了哦,( _ )/~~

评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

布小禅

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值