爬虫:SNKRS电商网站应该怎么反爬,反BOT

黄牛抢鞋的过程:

通常黄牛们都会用小程序不停地扫描SNKRS这样的电商网站,通过HTML里面的信息找到目标,比如AJ1,YEEZY等销量高的鞋。然后通过调用API的方式,实现“加入购物车”->“输入地址”->“付款”等步骤。

下图是SNKRS的HTML,里面包含了API和鞋子的基本信息。无论是通过API调用还是headless browser(无头浏览器), 这些信息都是识别的关键。
在这里插入图片描述

如何增加黄牛的难度呢?

通过对GitHub上天猫,京东,SNKRS,Adidas等黄牛软件的学习。发现了他们都普遍不具备AI的能力。所以,我们要怎样才能强迫BOTS使用AI,提升他们难度呢?
答案就是:字体混淆

下面图片中圈出来的两个地方,第一个是网页的原文,第二个是相应的HTML。可以发现,‘的’这个字,在HTML里面是一个‘框’,这也是黄牛会爬到的东西。如果电商网站上的商品名称或者尺码信息使用了混淆技术,那么黄牛就没办法知道应该买哪一双鞋了。
在这里插入图片描述

黄牛能否突破字体混淆呢?

答案是:能,但是很贵
字体混淆的成本很低,可以通过一些随机方法,生成几千套字体。
但是黄牛要怎么破解这几千套字体呢?

  1. 人工标注
  2. OCR

黄牛还有其他方法吗?

答案是:有的,但是一个持续斗智斗勇的过程了
比如:
场景1:
黄牛:通过搜索来锁定目标商品的位置
反黄牛:取消搜索框,比如SNKRS APP就没有搜索框

场景2:
黄牛:通过无头浏览器方式,通过锁定位置方式找到商品,而不是文本识别
反黄牛:商品位置加上随机策略

场景3:
黄牛:通过大量账号尝试,到了付款环节在确定商品是否正确,如果不正确就取消订单
反黄牛:在风控系统中,对这些长期下了订单不付款的账号进行分析,适当扣分或者封号

  • 6
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值