JS反爬虫

最新推荐文章于 2024-08-16 23:38:56 发布

Hao Tang

最新推荐文章于 2024-08-16 23:38:56 发布

阅读量1k

点赞数 2

分类专栏： js 文章标签： javascript

本文链接：https://blog.csdn.net/TangHao_0226/article/details/104659606

版权

本文详细介绍了JavaScript实现的四种反爬虫技术：通过JS写cookie进行身份验证，加密AJAX请求参数防止数据泄露，使用JS反调试阻止调试器分析，以及利用JS发送鼠标点击事件来确认合法访问。针对这些策略，文章给出了相应的爬虫应对措施，包括解析JS生成cookie，调试JS找到加密算法，解除JS反调试陷阱，以及模拟鼠标点击事件以绕过验证码或重定向问题。

摘要由CSDN通过智能技术生成

一、JS写cookie

我们要写爬虫抓某个网页里面的数据，无非是打开网页，看看源代码，如果html里面有我们要的数据，那就简单了。用requests请求网址得到网页源代码然后解析提取。

等等！requests得到的网页是一对JS，跟浏览器打开看到的网页源码完全不一样！这种情况，往往是浏览器运行这段JS生成一个（或多个）cookie再带着这个cookie做二次请求。服务器那边收到这个cookie就认为你的访问是通过浏览器过来的合法访问。

其实，你在浏览器（chrome、Firefox都可以）里可以看到这一过程。首先把Chrome浏览器保存的该网站的cookie删除，按F12到Network窗口，把“preserve log”选中（Firefox是“Persist logs”），刷新网页，这样我们就可以看到历史的Network请求记录。比如下图：
在这里插入图片描述
js写cookies