本文主要总结遇到的反爬虫的手段,加密。
一、Base64的加密(已解决)
二、AES的加密(已解决)
参考链接:https://www.cnblogs.com/libo0125ok/p/7668026.html
案例: http://ggzy.gzlps.gov.cn/jyxxgc/index.jhtml
效果图:
图一
从上图,可以看到 水城县2016年猴场片区城市棚户区改造综合整治配套基础设施建设项目建安工程中标候选人公示 的链接为:http://ggzy.gzlps.gov.cn:80/jyxxgcgs/22731.jhtml
但是:点击 后 会发现 链接改变了。变为 http://ggzy.gzlps.gov.cn/jyxxgcgs/Az2UE6o2FHYMxPtsLtiNyQ.jhtml
一定是后台做了处理,我们点击 图一 的 event .看看网站后台做了啥。
图二
如图二,可以看到 链接 在后台偷偷 执行了一个方法,对链接进行了加密。
将 jq代码 复制下来 ,慢慢分析。
function() {
var hh = $(this).attr("href"); 得到href的值
if (typeof(hh) == 'undefined' || hh == '#') { 判断是否为空,或者不为链接
return
}
下面为加密,准备参数
var aa = hh.split("/");
var aaa = aa.length;
var bbb = aa[aaa - 1].split('.');
var ccc = bbb[0];
var cccc = bbb[1];
var r = /^\+?[1-9][0-9]*$/;
var ee = $(this).attr('target');
if (r.test(ccc) && cccc.indexOf('jhtml') != -1) { 判断是否满足正则,或者cccc中包含jhtml
var srcs = CryptoJS.enc.Utf8.parse(ccc);
var k = CryptoJS.enc.Utf8.parse(s); 生成密钥
var en = CryptoJS.AES.encrypt(srcs, k, { 进行加密
mode: CryptoJS.mode.ECB,
padding: CryptoJS.pad.Pkcs7
});
var ddd = en.toString(); 后面生成加密的链接,并访问
ddd = ddd.replace(/\//g, "^");
ddd = ddd.substring(0, ddd.length - 2);
var bbbb = ddd + '.' + bbb[1];
aa[aaa - 1] = bbbb;
var uuu = '';
for (i = 0; i < aaa; i++) {
uuu += aa[i] + '/'
}
uuu = uuu.substring(0, uuu.length - 1);
if (typeof(ee) == 'undefined') {
window.location = uuu
} else {
window.open(uuu)
}
} else {
if (typeof(ee) == 'undefined') {
window.location = hh
} else {
window.open(hh)
}
}
return false
}
这里解密的话,需要上述的参考链接。https://www.cnblogs.com/libo0125ok/p/7668026.html
解密代码,如下
import javax.crypto.Cipher;
import javax.crypto.KeyGenerator;
import javax.crypto.spec.SecretKeySpec;
import org.apache.commons.codec.binary.Base64;
import sun.misc.BASE64Decoder;
public class Test11 {
//密钥
private static final String KEY = "qnbyzzwmdgghmcnm";
//算法
private static final String ALGORITHMSTR = "AES/ECB/PKCS5Padding";
/**
* base 64 encode
* @param bytes 待编码的byte[]
* @return 编码后的base 64 code
*/
public static String base64Encode(byte[] bytes){
return Base64.encodeBase64String(bytes);
}
/**
* AES加密
* @param txt 待加密的内容
* @param encryptKey 加密密钥
* @return 加密后的byte[]
* @throws Exception
*/
public static byte[] aesEncryptToBytes(String txt, String encryptKey) throws Exception {
KeyGenerator kgen = KeyGenerator.getInstance("AES");
kgen.init(128);
Cipher cipher = Cipher.getInstance(ALGORITHMSTR);
cipher.init(Cipher.ENCRYPT_MODE, new SecretKeySpec(encryptKey.getBytes(), "AES"));
return cipher.doFinal(txt.getBytes("utf-8"));
}
/**
* AES加密为base 64 code
* @param txt 待加密的内容
* @param encryptKey 加密密钥
* @return 加密后的base 64 code
* @throws Exception
*/
public static String aesEncrypt(String txt, String encryptKey) throws Exception {
return base64Encode(aesEncryptToBytes(txt, encryptKey));
}
public static void main(String[] args) {
try {
String url1 ="http://ggzy.gzlps.gov.cn:80/jyxxgcgs/22731.jhtml";
String txt=url1.substring(url1.length()-11,url1.length()-6);
System.out.println("加密前:" + txt);
String encrypt = aesEncrypt(txt, KEY);
String u = encrypt.substring(0, encrypt.length()-2).replace("/", "^");
System.out.println("加密后:" + u);
String a = url1.substring(0,url1.length()-12);
String url=a.replace(":80", "")+"/"+u+".jhtml";
System.out.println(url);
} catch (Exception e) {
e.printStackTrace();
}
}
}