HtmlUnit爬取动态数据(js相关)

最新推荐文章于 2021-11-30 10:36:00 发布

「已注销」

最新推荐文章于 2021-11-30 10:36:00 发布

阅读量3.7k

点赞数 2

分类专栏：爬虫技术文章标签： Jsoup爬取JS值 htmlunit

本文链接：https://blog.csdn.net/qin528032307/article/details/72231468

版权

今天在写一个爬虫的时候遇到了一个问题，就是在使用Jsoup获取html时只能解析静态的页面，只要是页面中与js相关的动态数据都是不能够爬取到的，在网上搜索了些资料后发现能够使用htmlunit来解决这个问题

参考资料：http://www.cnblogs.com/cation/p/3933408.html
jar包下载：http://sourceforge.net/projects/htmlunit/files/htmlunit/
简单使用：

// 创建模拟浏览器，参数可以指定不同类型的浏览器
WebClient webClient = new WebClient(); 

// 启用JS解释器，默认为true
webClient.getOptions().setJavaScriptEnabled(true); 

// 禁用css支持
webClient.getOptions().setCssEnabled(false</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
HtmlUnit爬取动态数据(js相关)

今天在写一个爬虫的时候遇到了一个问题，就是在使用Jsoup获取html时只能解析静态的页面，只要是页面中与js相关的动态数据都是不能够爬取到的，在网上搜索了些资料后发现能够使用htmlunit来解决这个问题参考资料：http://www.cnblogs.com/cation/p/3933408.htmljar包下载：http://sourceforge.net/projects/htmlunit
复制链接

扫一扫