拼多多搜索采集商品接口分析

page_id

10015_1637941183755_rkbb7cepo0  

拼多多的搜索流程:

第一次搜索是直接用网址URL的方式搜索

http://mobile.yangkeduo.com/search_result.html?search_key=%E7%9A%AE%E7%AD%8B

search_type=goods

source=index

options=3

search_met_track=manual

refer_page_el_sn=99885

refer_page_name=search_result

refer_page_id=10015_1637941872768_rqq2gpwp8j

refer_page_sn=10015

我们看到他有refer_page_el_sn    refer_page_id   refer_page_sn   3个参数

其中refer_page_id后面的1637941872768_rqq2gpwp8j找不到来源,并且是这个接口才开始出现,所以个人认为是随机生成(因为我随机的也不会出现异常)

然后10015估计是搜索的意思,因为这个值是固定.

但是如果出现了滑块,如果你滑块成功,那么refer_page_id的值就会变成10390_1637942122043_188s4i977t,也就是变成了10390.

注意:滑块成功后,他不会刷新URL网址,但是接口/proxy/api/search它里面的page_id已经更新了

搜索接口(滑动第二页):

http://mobile.yangkeduo.com/proxy/api/search?pdduid=4875988903

item_ver=lzqq

source=index

search_met=manual

track_data=refer_page_id,10390_1637942122043_188s4i977t

list_id=UKl1MOo3jA

sort=default

filter=

q=%E7%9A%AE%E7%AD%8B

page=2

is_new_query=1

size=50

flip=0%3B0%3B0%3B0%3B983d180d-88f6-443e-bf38-0455714dcba7

anti_content=0

其中,参数

track_data

list_id

flip

都是来自第一次搜索(html网址)里面包含的,注意,如果继续获取,遇到了滑块,并且你滑动只会,那么track_data和flip都会变,但是找不到来源(因为滑块成功后他不重新加载上一个接口mobile.yangkeduo.com/search_result.html)

flip 接口解码后是 0;0;0;20;983d180d-88f6-443e-bf38-0455714dcba7

其中20,是记录了上一次已经搜索到的总数



 经过这些参数的细节完善,能采集的数量就提高了不少。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诺离

创作不易,令君打赏,一分也是爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值