网站链接:http://ggzy.zwfwb.tj.gov.cn/jyxxzfcg/index.jhtml
列表页链接的访问:
结果返回的是403,访问出错,被禁止了
那么我们尝试点击url链接,进入详情页之后,发现真实的url为:
http://ggzy.zwfwb.tj.gov.cn/jyxxcggg/Xz+%5EO5FF%5EVC+tXKGVNYLOA.jhtml
显然是因为我们鼠标点击a标签之后引发的网页跳转
因此我们需要监听点击a标签之后发生了什么(执行了哪些动作),以此来判断究竟访问的是哪个网页
接下来进入鼠标事件内部
完整JavaScript代码:
$("a").bind('click', function() {
var hh = $(this).attr("href");
if (typeof (hh) == 'undefined' || hh == '#') {
hh = $(this).attr("url");
if (typeof (hh) == 'undefined' || hh == '#') {
return
}
}
var aa = hh.split("/");
var aaa = aa.length;
var bbb = aa[aaa - 1].split('.');
var ccc = bbb[0];
var cccc = bbb[1];
var r = /^\+?[1-9][0-9]*$/;
var ee = $(this).attr('target');
if (r.test(ccc) && cccc.indexOf('jhtml') != -1) {
var srcs = CryptoJS.enc.Utf8.parse(ccc);
var k = CryptoJS.enc.Utf8.parse(s);
var en = CryptoJS.AES.encrypt(srcs, k, {
mode: CryptoJS.mode.ECB,
padding: CryptoJS.pad.Pkcs7
});
var ddd = en.toString();
ddd = ddd.replace(/\//g, "^");
ddd = ddd.substring(0, ddd.length - 2);
var bbbb = ddd + '.' + bbb[1];
aa[aaa - 1] = bbbb;
var uuu = '';
for (i = 0; i < aaa; i++) {
uuu += aa[i] + '/'
}
uuu = uuu.substring(0, uuu.length - 1);
if (typeof (ee) == 'undefined') {
window.location = uuu
} else {
window.open(uuu)
}
} else {
if (typeof (ee) == 'undefined') {
window.location = hh
} else {
window.open(hh)
}
}
return false
});
如果看不懂js代码的话,可以在浏览器上面跑个流程看看
在浏览器上面也可以正常运行了
下一步,将同样的代码复制到vscode,看看脱离浏览器环境能否正常运行
结果报错$未定义,这是因为我们本地缺少浏览器的环境,我们去浏览器找$(this).attr('target');的值观察是什么情况
发现是写死的一个字符串:var ee = $(this).attr('target'); ee=‘_blank’
所以我们直接写死:var ee = '_blank'即可
修改后再次运行,结果报错CryptoJS is not defined
我们定义变量:var CryptoJS = require('crypto-js') 即可
反正扣js代码就是缺啥补啥即可,不知道是什么情况就去浏览器调试观察一下就ok了
最终就在脱离浏览器的环境也得到了正确的结果
ok,下面是最后一步,使用pycharm调用js代码即可大功告成了
首先我们需要将js代码封装成函数供pycharm来进行调用
cry_aes.js完整代码:
var CryptoJS = require('crypto-js')
function get_real_url(hh){
var s = 'qnbyzzwmdgghmcnm'
var aa = hh.split("/");
var aaa = aa.length;
var bbb = aa[aaa - 1].split('.');
var ccc = bbb[0];
var cccc = bbb[1];
var r = /^\+?[1-9][0-9]*$/;
var ee = '_blank'
if (r.test(ccc) && cccc.indexOf('jhtml') != -1) {
var srcs = CryptoJS.enc.Utf8.parse(ccc);
var k = CryptoJS.enc.Utf8.parse(s);
var en = CryptoJS.AES.encrypt(srcs, k, {
mode: CryptoJS.mode.ECB,
padding: CryptoJS.pad.Pkcs7
});
var ddd = en.toString();
ddd = ddd.replace(/\//g, "^");
ddd = ddd.substring(0, ddd.length - 2);
var bbbb = ddd + '.' + bbb[1];
aa[aaa - 1] = bbbb;
var uuu = '';
for (i = 0; i < aaa; i++) {
uuu += aa[i] + '/'
}
uuu = uuu.substring(0, uuu.length - 1);
return uuu;
}
}
console.log("real_url:",get_real_url("http://ggzy.zwfwb.tj.gov.cn:80/jyxxcggg/1133126.jhtml"))
编写完整的python代码:
import execjs
from loguru import logger
list_url = 'http://ggzy.zwfwb.tj.gov.cn:80/jyxxcggg/1133126.jhtml'
with open('cry_aes.js','r',encoding='utf-8') as f:
ctx = execjs.compile(f.read())
real_url = ctx.call('get_real_url',list_url)
logger.info(f"列表页url:{list_url},真实详情页url:{real_url}")
运行结果:
我们点击使用python获取的url:
说明我们得到了正确的详情页的url
至此我们的js逆向工作就全部完成了!