淘宝商品评论爬取历程整理

1.网页端接口

最容易找到的接口,https://h5api.m.tmall.com/h5/mtop.alibaba.review.list.for.new.pc.detail/1.0/,需要解决的问题就是sign加密,csdn搜一下满大街都是

缺陷:每页20条,最多7页,没办法拿到所有评论

2.H5接口

相对容易找到的接口,https://h5api.m.taobao.com/h5/mtop.taobao.rate.detaillist.get/6.0,每页10条,可以持续翻页

缺陷:容易被风控

3. 店透视插件

店透视插件可以下载所有评论,但是因为需要手动处理,比较麻烦,适合不懂技术的小白

4. 店透视接口

店透视访问的接口https://rate.tmall.com/feedRateList.htm,有一个加密参数ua,亲测可以去掉,但是怀疑去掉之后很容易被风控,而且这个接口没办法过滤”此用户没有填写评价“的评论,会获取大量没意义的评论。

5. 共有问题——滑块

多次调用上述任何接口,都会触发x82y滑块,现在滑块主要有三种类型:普通滑块、拉动出现某个画面就停止的滑块、连续按照要求多次点击的滑块,难度依次增加,而且无法用普通的selenium或者playwright搞定。目前已经解决,csdn也能搜到非常多文章,或者接口。

6. 共有问题——风控

终极问题,对于我们这种没有多账号的,爬的多了总会遇到风控,而且没办法跳过去。

使用付费代理可以有效降低风控几率,所以终极方法还是要多一些活跃账号,一个挂了就换另外一个。

总结:一万以内个商品的评论自己跑完全没问题,量大了还是找机构吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值