小记---------网页之htmlunit

   HtmlUnit是一款开元的Java页面分析工具,可以有效的使用htmlunit分析页面大汉的内容,项目可以模拟浏览器运行,被誉为Java浏览器的开元实现,这个没有界面的浏览器
 
API的使用
    模拟特定浏览器
        例:    WebClient webClient=new WebClient(BrowserVersion.FIREFOX_3);    //模拟火狐浏览器
 
查找特定元素
 通过get方法获取
        HtmlPage page=WebClient.getPage("网址");    //获取到网页源代码
        HtmlDivision div=(HtmlDivision)page.getElementById("hed");    //获取id属性值为hed的元素。
 
通过Xpath获取、
        HtmlDivision div=(HtmlDivision)page.getByXPath("//div").get(0);
System.out.println(div.asXml());    //输出代码
 
代理服务器的配置
    代理配置很简单,只需要配置好地址,端口,用户名与密码即可
    例://创建对象
 WebClient webClient=new WebClient(BrowserVersion.CHROME,"http://127.0.0.1",8087);     //模拟浏览器,代理IP地址   端口号
 
 DefaultCredentialsProvider credentialsProvider=webClient.getCredentialsProvider();  
 
//设置用户名密码 credentialsProvider.addCredentials(“username”,“password”);
 
 

转载于:https://www.cnblogs.com/yzqyxq/p/11574943.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值