[转]Htmlunit 创建webclient 模拟浏览器进行解析页面

1.该方法支持HTTP代理访问

2.集成的代码如下,改方法用的是模拟Firefox页面

public static final String userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0";
//创建Webclient成功
public void WebclientCreat(String proxyHost, int proxyPort) {
        // 用http代理
        webClient = new WebClient();
        //设置代理  
        ProxyConfig proxyConfig = webClient.getOptions().getProxyConfig();   
        proxyConfig.setProxyHost(proxyHost);    
        proxyConfig.setProxyPort(proxyPort); 
        try {
            webClient.getBrowserVersion().setUserAgent(userAgent);
            webClient.setRefreshHandler(new ThreadedRefreshHandler());
            //禁用Css,可避免自动二次请求CSS进行渲染  
            webClient.getOptions().setCssEnabled(false);
            //启动js
            webClient.getOptions().setJavaScriptEnabled(false);
            //运行报错不抛出异常
            webClient.getOptions().setThrowExceptionOnScriptError(false);
            webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
            webClient.getOptions().setRedirectEnabled(true);
            //时间
            webClient.getOptions().setTimeout(120000);
            //忽略ssl认证  
            webClient.getOptions().setUseInsecureSSL(true);
            webClient.setJavaScriptTimeout(300000);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

这里是在webclient创建成功之后访问页面

public void StartWebclient(){
    //访问的URL,suhu
    String url = "https://www.sohu.com/";
    //访问URL,将html页面渲染出来
    HtmlPage page = webClient.getPage(url);
    //能够查看sohu的主页面源码
    System.out.println(page.asXml());
}

————————————————
版权声明:本文为CSDN博主「杨冬冬」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/you_are_my_life/article/details/77525493

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值