火车头采集器 ajax json,火车采集器V9版Json功能介绍

本文详细介绍了如何利用火车采集器V9的Json功能来采集网页中的Json格式数据。通过示例展示了从抓包获取数据网址,到识别Json格式,再到使用Json工具进行数据提取的全过程。即使对Json不熟悉,也能通过工具轻松选取所需数据,实现高效采集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

很多网站的数据结构用到了Json格式,那么遇到这种格式的数据,用正常的采集规则是很难完美采集的,所以火车采集器V9也提供了Json采集的功能,今天这里给大家介绍下Json功能,如何去通过Json工具采集数据。

在这里主要介绍Json 所以我找了一个,Json格式的网页,仅对Json格式采集功能作介绍,其他略过,所以我也直接拿Json格式数据的网址作为内容页,下面请看详解。

我们要采的数据在网页中显示是这样的,如下图:

aec855b3c711063291a31285293f9999.png

我们要采集表格中的数据,发现在网页源码中并没有这些数据,通过抓包获得数据网址:https://baoxian.taobao.com/json/item/insuredProject.do?_ksTS=1493108856737_332&callback=jsonp333&item_id=43464493792(这里讲Json,怎么抓包获得的就不讲了)

打开网址我们发现数据是这样的,如下图:

459fa2fb72acc59de750b9ab98c3e9eb.png

通过上图,老司机可能觉得这也可以通过正常规则采集,是的上面的部分内容,确实可以通过正常规则采集,但大家注意看,保障说明、保障金额等是没办法正常采集的,其实懂的人一眼能看出来这是一个Json格式的数据。不懂得人怎么办呢?没关系,如果你遇到与这个类似格式的数据,我们先假设他就是Json,然后使用火车采集器的Json工具看能不能读取出数据。下面介绍火车采集器如何使用Json工具来采集。

035b78056f9ec4877bbfc1d3925880c1.png

先看上图,在内容标签采集设置这里,我们选择JSON提取,可以看到JSON工具,我们点击,出现下图:

d936f2bd058f50adba39b2631233be7b.png

参照上图,点击选择按钮,然后选择URL网址(这里先只介绍URL这一类型),然后把我们上面的网址输入进去,点击确定,如果能出现下图,这样的目录型结构,那就一定是Json格式了

0c4dbb3e886bfd064a45116b5b33aa80.png

我们继续,默认所有的都闭合的,需要我们点开,那就一个一个点看,只到发现你要的数据,数据一般都在data中,如上图中,desc中的文字信息是我们要的数据,总共16条,每条都需要,上图的右下角提示按Ctrl选多个节点,获取多条数据,在这里告诉大家,不管有多少条,如果你要获取多条数据不需要每个都点,只需点两条即可,可以看到上图中的JSON表达式中最后一个[]中的数值变成*号那就是代表采集多条数据。就这样,我们保存即可,然后以此类推,设置其他的标签,就是这么简单,使用JSON工具点点选选即可。

1d1245bdfa285b16452c09ea4c3ff1f0.png

经测试,完美采集到了,对了如果是多条数据要设置循环哦。赶紧去试试Json工具吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值