Java：java爬虫获取动态网页的数据

最新推荐文章于 2024-10-17 13:59:21 发布

Lay7

最新推荐文章于 2024-10-17 13:59:21 发布

阅读量2.5w

点赞数 6

分类专栏： java 文章标签： java 爬虫动态网页数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011343735/article/details/53507569

版权

说明：只是分享一种解决方案，代码以及部分截图不方便贴出，请谅解！

前段时间一直在研究爬虫，抓取网络上的特定的数据，如果只是静态网页就是再简单不过了，直接使用Jsoup ：

Document doc = Jsoup.connect(url).timeout(2000).get();

获取到Document 然后就想干嘛就干嘛了，但是一旦碰到一些动态生成的网站就不行了，由于数据是网页加载完成后执行js代码加载的，或者是用户滑动浏览触发的js加载数据，这样的网页使用Jsoup显然拿不到想要的数据。

后来使用 Selenium 来获取动态网页的数据，可以成功的拿到数据（实现方法），将程序打包后放在一台机器上运行，开始测试，然后结果不那么理想，经常会出现内存溢出，或者浏览器升级造成驱动与浏览器版本不匹配等一些列问题，今天早上来到公司发现程序又炸了，心里千万只草泥马啊！大半夜又没人动这台机器，鼠标键

最低0.47元/天解锁文章

关注

6
点赞
踩
31

收藏

觉得还不错? 一键收藏
11
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。