Fiddle++node JS逆向+request (采集APP必用)」||主流电商APP原数据采集接口

Fiddler是一个蛮好用的抓包工具,可以将网络传输发送与接受的数据包进行截获、重发、编辑、转存等操作。

我们在采集某个app时候,一般是先用Fiddler抓包 找到这个app请求这个数据时候调取的是后台的那个接口地址,找到这个地址和请求的参数然后再模拟request。今年在处理快手、抖音的粉丝、评价、商品店铺销量时候就用到了Fiddle。

某些APP 和网站的参数是通过js加密的,比如商标网、裁判文书网、抖音快手等这些。

您如果需要请求它的源api地址就地逆向解析破解这些加密参数,可以使用node解析混淆函数。因为平时需要经常采集一些app,所以和Fiddler打交道的比较多。

前面主要是对网站和APP 数据采集和解析的一些方法,其实对这种网站爬虫技术说无非就解决三个问题:首先是封IP问题,您可以自建代理IP池解决这个问题的,第二个问题就是验证码问题,这个问题可以通过python的图像识别技术来解决或者是您直接调取第三方的打码平台解决。第三问题就是需要会员账号登录后才看到的数据,这个很简单直接用cookie池解决。


主流电商APP原数据采集接口

京东获得JD商品详情原数据 API 返回值说明

item_get_app-获得JD商品详情原数据 [查看演示] API注册测试

jd.item_get_app

公共参数

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

请求参数

请求参数:num_iid=10335871600

参数说明:item_id:商品ID

响应参数

Version: Date:

名称类型必须示例值描述

items

item[]0获得京东app商品详情原数据

 

item_get_app-获得淘宝app商品详情原数据 

taobao.item_get_app

公共参数

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

请求参数

请求参数:num_iid=520813250866

参数说明:num_iid:淘宝商品ID

响应参数

Version: Date:

名称类型必须示例值描述

item

Mix0获得淘宝app商品详情原数据

 它提供数据采集浏览器、网络解锁器、数据采集托管IDE三种方式,能通过简单的几十行Python代码实现复杂网络数据的采集,对于反爬、验证码、动态网页等进行自动化处理,完全不需要你操心。

  • 11
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值