JAVA爬虫https_java爬虫问题一：解决使用htmlunit 时候ssl认证失败问题

最新推荐文章于 2024-03-10 22:14:21 发布

是个少女

最新推荐文章于 2024-03-10 22:14:21 发布

阅读量261

点赞数

文章标签： JAVA爬虫https

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34221654/article/details/114465326

版权

java爬虫问题一：解决使用htmlunit 时候ssl认证失败问题

凯哥Java 凯哥java

前言：

在使用htmlunit 爬取其他网站信息的时候，提示错误信息：unable to find valid certification path to requested target

意思：

说明证书问题。各种检索，使用了很多方法，以下记录解决思路：

解决方案一：

一种解决方案是： webClient.getOptions().setUseInsecureSSL(true);

这么设置之后，确实没有在提示unable to find valid certification path to requested target错误了。但是引发了其他的问题。所以该方案不成立。

继续排查：

解决方案二：

设置setUseInsecureSSL(false);

重要代码：

WebClient webClient = new WebClient(BrowserVersion.CHROME);

/*** htmlunit unable to find valid certification path to requested target

**/

webClient.getOptions().setThrowExceptionOnScriptError(false);//当JS执行出错的时候是否抛出异常, 这里选择不需要

webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);//当HTTP的状态非200时是否抛出异常, 这里选择不需要

webClient.getOptions().setActiveXNative(false);

// webClient.getOptions().setCssEnabled(false);//是否启用CSS, 因为不需要展现页面, 所以不需要启用

webClient.getOptions().setJavaScriptEnabled(true); //很重要，启用JS

webClient.setAjaxController(new NicelyResynchronizingAjaxController());//很重要，设置支持AJAX

添加上面代码问题完美解决。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。