爬虫获取ajax异步请求的html内容

最新推荐文章于 2024-07-26 17:44:44 发布

奇妙探险家

最新推荐文章于 2024-07-26 17:44:44 发布

阅读量3w

点赞数 13

分类专栏：爬虫文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013760453/article/details/54898127

版权

爬虫专栏收录该内容

2 篇文章 1 订阅

订阅专栏

使用爬虫时有时会发现浏览器中看到的html内容在程序get()的结果中看不到，这是因为页面中使用了ajax技术，即在加载页面时不一次性发出所有内容，浏览器收到第一次发出的页面内容后运行其中的程序，再向服务器请求部分内容构成完整页面，用爬虫只能得到第一次发出的html，导致无法得到所需内容。

此处::befer和::after之间的部分在使用爬虫的get()方法得到的html中看不到，因为这是异步加载的。

此时可以选择network标签，刷新页面，在name文件列表中找到包含所需内容的文件，这就是页面程序运行后向服务器请求的第二部分数据

在headers标签中显示了生成该文件的请求信息，在本例中可以看到是向https://www.bjotc.cn/front/ajax_getGuaPaiQiYeList.do发出了post请求，请求参数在最下方form data中，

点击viewsource可以看到参数形式为key=113%2C-1&page=1，在浏览器中输入https://www.bjotc.cn/front/ajax_getGuaPaiQiYeList.do?key=113%2C-1&page=1即可看到获取的信息，接下来就可以使用爬虫对该链接发出请求，爬取原来无法获取的信息！

奇妙探险家

关注

13
点赞
踩
40

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

奇妙探险家 CSDN认证博客专家 CSDN认证企业博客

码龄11年

148: 原创

7万+: 周排名

166万+: 总排名

33万+: 访问

: 等级

4265: 积分

34: 粉丝

120: 获赞

33: 评论

265: 收藏

私信

关注

热门文章

分类专栏

kafka 1篇
报表工具 1篇
python 26篇
mysql 18篇
linux 17篇
hadoop 10篇
hive 9篇
java 27篇
爬虫 2篇
kettle 1篇
spark 7篇
Shell 4篇
Maven 7篇
git 3篇
VBA 1篇
阅读材料 1篇
scala 1篇
IntelliJ IDEA 7篇
SQL 10篇
项目记录
磐石项目
Megalith
数据仓库 4篇
教程链接 1篇
oracle 5篇
informatica 9篇
docker 3篇
ETL 1篇
greenplum 1篇

最新评论

使用python统计高频词，模糊匹配不规范公司名称
weixin_50755808: 那如果是公司地址的，比如你要做一个某个省市的公司地址，其中有的地址的字段很相似，那么我怎么筛选也许是两个相同的地址，比如第一个地址精确到门牌号，第二个地址有前一个相似的门牌号，然后还有别的字段，我怎么区分》在线问，不急
使用python统计高频词，模糊匹配不规范公司名称
breakthrough：）: 抱歉问一个比较弱智的问题我在jupyter notebook里面import jieba它显示module not found该怎么办啊
oracle笔记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)使用更多的站内链接；(3)增加条理清晰的目录。
akka并发通信、actor模型的理解
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7975834, 请多输出高质量博客, 帮助更多的人
shell命令笔记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。