反爬虫某超级难破解网站心得汇总

最新推荐文章于 2022-10-18 16:54:12 发布

颖宝家的楚凡

最新推荐文章于 2022-10-18 16:54:12 发布

阅读量294

点赞数 1

文章标签： java python flask javascript 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21941317/article/details/125079769

版权

平心而论，这是记录这段时间的辛苦成果，一群人破解啦很久没破解出来，最后破解出来，还是很有成就感的。

为什么说这个网站超难破解，让我一一道来

1.对python语言去采集不太好，python尝试啦几次都不行，人家系统能识别出来，其他java,js,rust,go，php,shell等其他语言都是支持的，python去写，反而麻烦啦，python在这次破解采集数据中扮演者就处理数据的角色，再次强调，python只能作为工程师技能，别被某音，培训班骗啦，不要把它当职业语言。

2.网站封号，封ip很严重，即使你是一个正常用户操作点击，只要频率稍微点击过快，也会给你封一天，或者n天。ip这个很坑，市面上虽然代理挺多，但是网速能跟得上的不多，除非你开代理跑数据，其他浏览网站在其他设备上，当我没说

3.请求数据这个多坑呢，n个加密参数，webpack打包，你需要扣函数，扣到你吐血，最主要几个加密参数都带时间戳的加密，时间戳处理形式还不一样也就是说参数顺序你不能乱，按时间间隔都要计算好

4.cookie的坑，request.cookie和response.cookie坑，自定义生成规则，不做赘述

5.网站识别用户身份是加密字段，和当前用户ip绑定到一起，又是一坑

6.相应内容是一堆你看不懂的几百个阿拉伯数字

7.字体是自定义字体，没错，需要用到knn识别技术，机器算法走起啦

其他坑不做叙述，呵呵。

颖宝家的楚凡

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
反爬虫某超级难破解网站心得汇总

记录一次异常艰难的反爬之旅程
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。