java获取https网页代码_java抓取Https协议url地址的源码的方法

本文介绍了如何在Java中通过加载信任证书来抓取HTTPS网址的源码。提供了一个名为MyX509TrustManager的类,该类实现了X509TrustManager接口,用于绕过证书验证。示例代码展示了如何使用该类从指定HTTPS URL获取页面内容并打印源码。
摘要由CSDN通过智能技术生成

阅读本文之前,请先阅读下文,通过下文将获取到keystore文件:

在此,感谢一下stevenliu,不过经过我的测试,发现stevenliu文章中的源码并没有抓取到页面源码。可能是我项目里面的HttpClient版本较高的原因。下面这个方法没有问题:

package org.phoenix.cases.webservice;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.net.URL;

import java.security.KeyStore;

import java.security.SecureRandom;

import java.security.cert.CertificateException;

import java.security.cert.X509Certificate;

import java.util.List;

import javax.net.ssl.HttpsURLConnection;

import javax.net.ssl.SSLContext;

import javax.net.ssl.SSLSocketFactory;

import javax.net.ssl.TrustManager;

import javax.net.ssl.TrustManagerFactory;

import javax.net.ssl.X509TrustManager;

import org.apache.commons.io.IOUtils;

/**

* java通过加载认证证书,抓取https的url源码方法

* @author mengfeiyang

*

*/

public class MyX509TrustManager implements X509TrustManager {

private X509TrustManager sunJSSEX509TrustManager;

public MyX509TrustManager(String keystoreFile,String pass) throws Exception {

KeyStore ks = KeyStore.getInstance("JKS");

ks.load(new FileInputStream(keystoreFile),pass.toCharArray());

TrustManagerFactory tmf = TrustManagerFactory.getInstance("SunX509", "SunJSSE");

tmf.init(ks);

TrustManager tms [] = tmf.getTrustManagers();

for (int i = 0; i 

if (tms[i] instanceof X509TrustManager) {

sunJSSEX509TrustManager = (X509TrustManager) tms[i];

return;

}

}

throw new Exception("Couldn't initialize");

}

@Override

public void checkClientTrusted(X509Certificate[] chain, String authType) throws CertificateException {

try {

sunJSSEX509TrustManager.checkClientTrusted(chain, authType);

} catch (CertificateException excep) {

excep.printStackTrace();

}

}

@Override

public void checkServerTrusted(X509Certificate[] chain, String authType) {

try {

sunJSSEX509TrustManager.checkServerTrusted(chain, authType);

} catch (CertificateException excep) {

excep.printStackTrace();

}

}

@Override

public X509Certificate[] getAcceptedIssuers() {

return sunJSSEX509TrustManager.getAcceptedIssuers();

}

public static void main(String[] args) throws Exception {

TrustManager[] tm = { new MyX509TrustManager("E:\\mycert.keystore","123456") };

SSLContext sslContext = SSLContext.getInstance("SSL", "SunJSSE");

sslContext.init(null, tm, new SecureRandom());

SSLSocketFactory ssf = sslContext.getSocketFactory();

URL myURL = new URL("https://beta.tf.360.cn/search/mapi?keyword=途牛");

HttpsURLConnection httpsConn = (HttpsURLConnection) myURL.openConnection();

httpsConn.setSSLSocketFactory(ssf);

InputStreamReader insr = new InputStreamReader(httpsConn.getInputStream());

List ls = IOUtils.readLines(insr);

for(String l : ls){

System.out.println(l);//打印源码

}

httpsConn.getResponseCode();//获取的状态码

}

}

在我的phoenixframework自动化平台的接口测试模块中,下个版本将会增加https的操作。因为发现现在越来越多的网站是https了。phoenixframework平台网站:http://www.cewan.la

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值