百度翻译js渗透

项目:python请求百度翻译API接口

流程:
1、目标网站:www.fanyi.baidu.com
2、抓包找到正确的动态请求
3、分析请求参数,找出会变化的参数sign、token
4、JS渗透,找出参数js生产过程
5、模拟js生产参数过程
一、抓包分析
带翻译结果的链接是https://fanyi.baidu.com/v2transapi?from=zh&to=en
在这里插入图片描述
通过两次抓包得到的请求参数,通过对比发现不同的参数为,query,sign,第二次抓包多了transtype参数
这个参数翻译长句的时候是需要的,另外虽然token参数两次抓包没有变化是因为抓包相隔时间较短如果过10来分钟再抓包的话token参数可能是会发生变化的,所以token也要当做会变的参数来处理
在这里插入图片描述
token参数通过全局搜索,在网页源码中科院找到,通过fanyi.baidu.com请求+正则匹配可以获取到
在这里插入图片描述
sign参数是js生产的需要渗透到js里找
在Network找到翻译链接,从Initiator进入js
在这里插入图片描述
打断点,刷新网页
在这里插入图片描述
逐个点击进入堆栈里的函数,查找sign,最终在onTrans里找到sign
在这里插入图片描述
可以看到sign1是由y(n)函数产生的,接下来点击进入y(n)在这里插入图片描述
调到了e®函数,这个函数是将“需要翻译的文本”传入最终返回sign,将这个函数复制到python中用execjs运行将得到sign,复制的时候注意要讲n(r,o) 函数和var i=null以前复制英文n函数和i变量是属于e函数里面的没以前复制的话运行会报错,另外window[l]是去window下gtk的值,这个gtk也可以在网页源码里找到
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
二、代码
js代码
`function n(r, o) {
for (var t = 0; t < o.length - 2; t += 3) {
var a = o.charAt(t + 2);
a = a >= “a” ? a.charCodeAt(0) - 87 : Number(a),
a = “+” === o.charAt(t + 1) ? r >>> a : r << a,
r = “+” === o.charAt(t) ? r + a & 4294967295 : r ^ a
}
return r
}
var i = null;

function e(r, gtk) {
var o = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);
if (null === o) {
var t = r.length;
t > 30 && (r = “” + r.substr(0, 10) + r.substr(Math.floor(t / 2) - 5, 10) + r.substr(-10, 10))
} else {
for (var e = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), C = 0, h = e.length, f = []; h > C; C++)
“” !== e[C] && f.push.apply(f, a(e[C].split(""))),
C !== h - 1 && f.push(o[C]);
var g = f.length;
g > 30 && (r = f.slice(0, 10).join("") + f.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join("") + f.slice(-10).join(""))
}
var u = void 0,
l = “” + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);
//找不到window[l],只有在浏览器环境下起作用
u = null !== i ? i : (i = gtk || “”) || “”;
for (var d = u.split("."), m = Number(d[0]) || 0, s = Number(d[1]) || 0, S = [], c = 0, v = 0; v < r.length; v++) {
var A = r.charCodeAt(v);
128 > A ? S[c++] = A : (2048 > A ? S[c++] = A >> 6 | 192 : (55296 === (64512 & A) && v + 1 < r.length && 56320 === (64512 & r.charCodeAt(v + 1)) ? (A = 65536 + ((1023 & A) << 10) + (1023 & r.charCodeAt(++v)),
S[c++] = A >> 18 | 240,
S[c++] = A >> 12 & 63 | 128) : S[c++] = A >> 12 | 224,
S[c++] = A >> 6 & 63 | 128),
S[c++] = 63 & A | 128)
}
for (var p = m, F = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), D = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + ("" + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + ("" + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), b = 0; b < S.length; b++)
p += S[b],
p = n(p, F);
return p = n(p, D),
p ^= s,
0 > p && (p = (2147483647 & p) + 2147483648),
p %= 1e6,
p.toString() + “.” + (p ^ m)
}`

python代码

import requests,json,re,execjs
sess=requests.Session()

def get_sign(string,gtk):
    with open('fanyi.js','r',encoding='utf8') as f:
        js=f.read()
    return execjs.compile(js).call('e',string,gtk)


#需要请求两次以上得到token才是有效的
def get_token_gtk():
    url='https://fanyi.baidu.com/'
    for i in range(2):
        header={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36',}
        r=sess.get(url,headers=header)
        #获取token
        result=re.search("token: '(.+)',",r.text)
        token=result.group(1)
    #获取gtk
    gtk=re.search(";window.gtk = '(.+)';",r.text).group(1)
    return token,gtk


def fanyi(string,sign,token):
    # 自动检测语言类型
    langRes=sess.post('https://fanyi.baidu.com/langdetect',data={'query':string})
    langSourceType=json.loads(langRes.text)['lan']
    
    data={
        'from': langSourceType,
        'to': 'en',
        'query': string,
        'transtype': 'realtime',
        'simple_means_flag': '3',
        'sign': sign,
        'token': token
    }
    fanyi_url='https://fanyi.baidu.com/v2transapi'
    r=sess.post(fanyi_url,data=data)
    print(json.loads(r.text)['trans_result']['data'][0]['dst'])

if __name__ == "__main__":
    while True:
        #输入要翻译的文字
        string=input('请输入你要翻译的字段:')
        # 获取token和gtk
        token,gtk=get_token_gtk()
        # 获取sign
        sign=get_sign(string,gtk)
        # 翻译
        fanyi(string,sign,token)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值