反爬虫之Ajax简介

最新推荐文章于 2024-04-29 07:39:30 发布

kayotin

最新推荐文章于 2024-04-29 07:39:30 发布

阅读量1.4k

点赞数 18

分类专栏： Python项目实践文章标签：爬虫 ajax 前端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kayotin/article/details/135727012

版权

Python项目实践专栏收录该内容

13 篇文章 0 订阅

订阅专栏

爬虫之Ajax请求

很多网站的页面都是动态的，也就是一开始请求只能得到一个模板的壳子，然后里面的数据通过ajax结合js进行渲染。这就导致如果直接请求原始网站url，是拿不到想爬取的数据的。这里面也有一些区别。

通过固定api接口拿到

这样的ajax封装就比较好破解，它的api接口url是固定的或者说有简单的规律。

比如网易云音乐，歌曲页面的链接如下：

https://music.163.com/#/song?id=536624574

而歌曲评论的api链接如下：

https://music.163.com/api/v1/resource/comments/R_SO_4_536624574?limit=20&offset=0

直接请求就能得到评论数据了。

在这里插入图片描述

对于这种数据的抓取，可以参考如下博客的例子：

https://cuiqingcai.com/202253.html

猫眼的各个api：

https://blog.csdn.net/Anana13/article/details/107554897

加密ajax链接生成的api接口

某些爬虫拦截做的比较严格的网站，它的api接口是通过加密算法生产的。比如下面这个例子，电影的详细信息是通过如下截图的ajax请求的到的：

在这里插入图片描述

具体链接是：

https://www.maoyan.com/ajax/films/1458876?timeStamp=1705803955236&index=1&signKey=f8c449e03201a06386b67c9d2b5b13c7&channelId=40011&sVersion=1&webdriver=false

这个链接中的timeStamp、index和signKey三个参数是通过加密算法生成的。

具体来说是通过下图的js代码生成的

在这里插入图片描述

那么如果对这些js代码进行解析，每次进行请求时，按照相同的逻辑生成这些参数就可以了。思路确实没错，但我前端的功力太差了，说实话不太看得懂。

网上有一些文章对之前的js代码做了逆向的，可以参考如下链接。不过目前猫眼的js代码已更新，目前已经不可用了。但是思路是一样的可以了解下：

这些例子里都是通过pyexecjs这个库来在python里运行js代码。

结论

对于一般的ajax请求，知道具体的请求url就可以了；对于js加密的，要么刻苦钻研前端技术，要么你有一个前端很厉害的朋友py交易帮你分析下。

参考链接：

https://cuiqingcai.com/202253.html

https://juejin.cn/post/7058594691670867982

https://www.cnblogs.com/liuze-2/p/15856469.html#2-利用js逆向模拟请求得到电影评分的页面

关注

18
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
反爬虫之Ajax简介

对于常见翻爬虫措施-ajax请求的一些理解总结。
复制链接

扫一扫

专栏目录

kayotin CSDN认证博客专家 CSDN认证企业博客

码龄4年

82: 原创

6万+: 周排名

2万+: 总排名

6万+: 访问

: 等级

1515: 积分

532: 粉丝

703: 获赞

7: 评论

835: 收藏

私信

关注

热门文章

分类专栏

最新评论

在VMvare中虚拟机安装centos7和初始设置
kayotin: 已修改。这个复制和快照因为太简单了就没写了。实际操作就知道了。图片已加。
在VMvare中虚拟机安装centos7和初始设置
XjDoo: 您好，博主，选择时区和时间那里有张图片违规看不到了，还有那个，“镜像和克隆”那里把刚刚安装好的做快照，复制一台新的有没有具体操作演示
Python中数据库操作pymysql和 sqlalchemy
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
通过docker在容器中通过Gunicorn运行flask
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
算法3&4_数据结构&数组和链表
ha_lydms: 我很喜欢作者的写作风格，总是能够吸引我不断地深入阅读，让我感到非常愉悦和满足。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。