爬虫全系列知识点总结

最新推荐文章于 2024-07-26 10:45:15 发布

顶级爬虫-西楚霸王

最新推荐文章于 2024-07-26 10:45:15 发布

阅读量891

点赞数 1

文章标签：爬虫搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45918935/article/details/130962821

版权

爬虫分为：

1.垂直获取型爬虫，也就是自己针对特定网站（web）或APP得采集也包括客户端软件。

2.类似于搜索引擎的爬虫，自动获取各种网站智能解析各种数据

其中WEB端爬虫得难点在于（JS逆向、浏览器环境伪造、以及高度可用的IP和Cookie)

目前存在的反爬痛点（WEB）

1.目前JS逆向得反爬点主要集中于JS混淆加密（AA\JJ\JSFUCK\OB\sojson）类似于这些主要增加冗余代码降低JS代码的可读性。除此之外还有(JSVMP\WASM)类似于这些。

2.一些反调试操作比如（无限DEBUG、监听DOM事件和一些错误的干扰逻辑）

3.风控反爬（服务器端收集你的操作和浏览器身份比如你的浏览器插件和屏幕宽高等）生成一段指纹包括（JA3）TLS指纹等

目前存在的痛点（APP)

1.APP做了加固处理，你不好HOOK到加密生成逻辑甚至写进了二进制文件中

2.APP做了指纹校验，他会检测你的客户端身份

3.APP走了一些私有协议

顶级爬虫-西楚霸王

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
爬虫全系列知识点总结

1.目前JS逆向得反爬点主要集中于JS混淆加密（AA\JJ\JSFUCK\OB\sojson）类似于这些主要增加冗余代码降低JS代码的可读性。3.风控反爬（服务器端收集你的操作和浏览器身份比如你的浏览器插件和屏幕宽高等）生成一段指纹包括（JA3）TLS指纹等。其中WEB端爬虫得难点在于（JS逆向、浏览器环境伪造、以及高度可用的IP和Cookie)1.垂直获取型爬虫，也就是自己针对特定网站（web）或APP得采集也包括客户端软件。2.一些反调试操作比如（无限DEBUG、监听DOM事件和一些错误的干扰逻辑）
复制链接

扫一扫

顶级爬虫-西楚霸王 CSDN认证博客专家 CSDN认证企业博客

码龄5年

13: 原创

132万+: 周排名

13万+: 总排名

6017: 访问

: 等级

162: 积分

21: 粉丝

23: 获赞

11: 评论

24: 收藏

私信

关注

热门文章

分类专栏

dockers 2篇
splash 1篇
python3.11 1篇

最新评论

爬虫全系列知识点总结
CSDN-Ada助手: 恭喜你写了这么一篇全面的爬虫知识总结，相信会对很多人有所帮助。不过，知识点总结只是爬虫学习的一个方面，希望你能够继续不断深入学习，将自己的经验和心得分享出来，让更多的人受益。期待你的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
解决centos7.6 python3.11报错ssl error
Zpython3: 万能cookie 教教我，wangba
centos常用命令集锦
Zpython3: 万能cookie 教教我，wangba
解决docker内存过载问题
Zpython3: 万能cookie 教教我，wangba
解决docker容器程序内存过载自动重启超级实用
Zpython3: 万能cookie 教教我，wangba

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。