1.网页端接口
最容易找到的接口,https://h5api.m.tmall.com/h5/mtop.alibaba.review.list.for.new.pc.detail/1.0/,需要解决的问题就是sign加密,csdn搜一下满大街都是
缺陷:每页20条,最多7页,没办法拿到所有评论
2.H5接口
相对容易找到的接口,https://h5api.m.taobao.com/h5/mtop.taobao.rate.detaillist.get/6.0,每页10条,可以持续翻页
缺陷:容易被风控
3. 店透视插件
店透视插件可以下载所有评论,但是因为需要手动处理,比较麻烦,适合不懂技术的小白
4. 店透视接口
店透视访问的接口https://rate.tmall.com/feedRateList.htm,有一个加密参数ua,亲测可以去掉,但是怀疑去掉之后很容易被风控,而且这个接口没办法过滤”此用户没有填写评价“的评论,会获取大量没意义的评论。
5. 共有问题——滑块
多次调用上述任何接口,都会触发x82y滑块,现在滑块主要有三种类型:普通滑块、拉动出现某个画面就停止的滑块、连续按照要求多次点击的滑块,难度依次增加,而且无法用普通的selenium或者playwright搞定。目前已经解决,csdn也能搜到非常多文章,或者接口。
6. 共有问题——风控
终极问题,对于我们这种没有多账号的,爬的多了总会遇到风控,而且没办法跳过去。
使用付费代理可以有效降低风控几率,所以终极方法还是要多一些活跃账号,一个挂了就换另外一个。
总结:一万以内个商品的评论自己跑完全没问题,量大了还是找机构吧