Java抓取动态加载js后的网页-PhantomJS

       最近有一个抓取网页内容的需求,但是加载的网页的有的元素是通过js动态加载完成的,使用简单的HttpURLConnection无法运行js文件。

       此篇介绍一个PhantomJS的API,PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。它不仅是个隐形的浏览器,提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等,同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。

       PhantomJS的用处可谓非常广泛,诸如网络监测、网页截屏、无需浏览器的 Web 测试、页面访问自动化等。

       PhantomJS的官网:http://phantomjs.org/

       在PhantomJS官网然后点击“Install”进行下载;

     Java整合PhantomJS案例:

     https://blog.csdn.net/niuba123456/article/details/85164274

        

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值