搞站的都应该采集过搜狐号文章,不过最近搜狐号文章图片加密了。当发送HTTP请求后或你使用采集软件时,想要直接截取搜狐号文章正文时,哐当发现搜狐号文章img图片路径加密了???
仔细看下搜狐号文章正文img标签路径都被加密,但是通过浏览器访问是正常的,盲猜js在作怪。
直接从裤裆掏出F12,断点调式。一眼看出是AES加密,知道加密方法了。直接调用CryptoJS库解密就可以了!
CryptoJS加密模块AES ECB pkcs7 key是www.sohu.com6666
js调用例子:需要引用CryptoJS加密库
var key = CryptoJS.enc.Utf8.parse("www.sohu.com6666");
function AES_Encrypt(word) {
var srcs = CryptoJS.enc.Utf8.parse(word);
var encrypted = CryptoJS.AES.encrypt(srcs, key, {
mode: CryptoJS.mode.ECB,
padding: CryptoJS.pad.Pkcs7
});
return encrypted.toString();
}
function AES_Decrypt(word) {
var srcs = word;
var decrypt = CryptoJS.AES.decrypt(srcs, key, {
mode: CryptoJS.mode.ECB,
padding: CryptoJS.pad.Pkcs7
});
return decrypt.toString(CryptoJS.enc.Utf8);
}
PHP调用例子:
$str='8MY9RGaCWaBsd6kkgG/pST3npzZkiPX4IvYa+fMD5xBnXzWJM1dhGDZrzNHYnjVAr9n23rf3YhtLGja+NUz0NsY2Ys5srh6/tMRWSaPtnSE=';
$encrypted = base64_decode($str);
$reslut= openssl_decrypt($encrypted, 'AES-128-ECB', 'www.sohu.com6666', OPENSSL_RAW_DATA);
echo $reslut;