Python爬虫入门教程22:百度翻译JS解密

for (var e = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), C = 0, h = e.length, f = []; h > C; C++)

“” !== e[C] && f.push.apply(f, a(e[C].split(“”))),

C !== h - 1 && f.push(o[C]);

var g = f.length;

g > 30 && (r = f.slice(0, 10).join(“”) + f.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join(“”) + f.slice(-10).join(“”))

}

var u = void 0

, l = “” + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);

u = null !== i ? i : (i = window[l] || “”) || “”;

for (var d = u.split(“.”), m = Number(d[0]) || 0, s = Number(d[1]) || 0, S = [], c = 0, v = 0; v < r.length; v++) {

var A = r.charCodeAt(v);

128 > A ? S[c++] = A : (2048 > A ? S[c++] = A >> 6 | 192 : (55296 === (64512 & A) && v + 1 < r.length && 56320 === (64512 & r.charCodeAt(v + 1)) ? (A = 65536 + ((1023 & A) << 10) + (1023 & r.charCodeAt(++v)),

S[c++] = A >> 18 | 240,

S[c++] = A >> 12 & 63 | 128) : S[c++] = A >> 12 | 224,

S[c++] = A >> 6 & 63 | 128),

S[c++] = 63 & A | 128)

}

for (var p = m, F = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + (“” + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), D = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + (“” + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + (“” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), b = 0; b < S.length; b++)

p += S[b],

p = n(p, F);

return p = n(p, D),

p ^= s,

0 > p && (p = (2147483647 & p) + 2147483648),

p %= 1e6,

p.toString() + “.” + (p ^ m)

}

在这里插入图片描述

同样的通过断点调试可以看到参数 r 是需要翻译的内容。

在这里插入图片描述

当在pycharm里面调用函数的时候发生了报错,这个报错不用担心,在JS解密当中,如果运行JS代码代码报错了,一般是说xxx没有定义,所以缺那些内容就在JS代码中补充那些内容,这里显示是缺少 i 。

在这里插入图片描述

可以在开发者工具中看到 这个 i 貌似一个数字,可以重新换一个翻译的词看一下是否会改变。

在这里插入图片描述

更换翻译的词之后还是一样的,那就可以直接复制这个参数,定义一下。

var i = ‘320305.131321201’

在这里插入图片描述

在运行发现少一个n,和之前是一样的那么我们就去找一下n,还是一样的在开发者工具中选择 n 然后跳转到它所在的函数,然后复制下来

function n(r, o) {

for (var t = 0; t < o.length - 2; t += 3) {

var a = o.charAt(t + 2);

a = a >= “a” ? a.charCodeAt(0) - 87 : Number(a),

a = “+” === o.charAt(t + 1) ? r >>> a : r << a,

r = “+” === o.charAt(t) ? r + a & 4294967295 : r ^ a

}

return r

}

在这里插入图片描述

这一下 sign 参数就出来了。

在这里插入图片描述

分析就到这里结束了,接下来就是使用python调用JS代码了。

💥Python调用JS代码


这里需要一个模块 execjs 它的安装方式是 pip install pyexecjs 这里需要注意下。

with open(‘百度翻译JS.js’, mode=‘r’, encoding=‘utf-8’) as f:

js_code = f.read()

compile_result = execjs.compile(js_code)

sign = compile_result.call(‘e’, ‘你好’)

需要注意的就是 compile_result.call 没有语法提示的,需要自己手敲,另外就是 调用js代码中的函数是字符串。。。

然后就是你正常的python代码 post 请求翻译地址,然后返回Json数据 解析提取 翻译结果就好了。

💥完整代码


Python代码

import execjs

import requests

while True:

key_word = input(‘请输入你要翻译的内容(输入0退出):’)

if key_word == ‘0’:

break

with open(‘百度翻译JS.js’, mode=‘r’, encoding=‘utf-8’) as f:

js_code = f.read()

compile_result = execjs.compile(js_code)

sign = compile_result.call(‘e’, key_word)

url = ‘https://fanyi.baidu.com/v2transapi?from=zh&to=en’

headers = {

‘Cookie’: ‘输入你自己的cookie’,

‘Host’: ‘fanyi.baidu.com’,

‘Origin’: ‘https://fanyi.baidu.com’,

‘Referer’: ‘https://fanyi.baidu.com/?aldtype=16047’,

‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36’,

}

data = {

‘from’: ‘zh’,

‘to’: ‘en’,

‘query’: key_word,

‘transtype’: ‘realtime’,

‘simple_means_flag’: ‘3’,

‘sign’: sign,

‘token’: ‘ff0dd9077e8dd121d1aa29f684670b58’,

‘domain’: ‘common’,

}

response = requests.post(url=url, data=data, headers=headers)

result = response.json()[‘trans_result’][‘data’][0][‘dst’]

print(result)

JS代码

var i = ‘320305.131321201’;

function n(r, o) {

for (var t = 0; t < o.length - 2; t += 3) {

var a = o.charAt(t + 2);

a = a >= “a” ? a.charCodeAt(0) - 87 : Number(a),

a = “+” === o.charAt(t + 1) ? r >>> a : r << a,

r = “+” === o.charAt(t) ? r + a & 4294967295 : r ^ a

}

return r

}

function e® {

var o = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);

if (null === o) {

var t = r.length;

t > 30 && (r = “” + r.substr(0, 10) + r.substr(Math.floor(t / 2) - 5, 10) + r.substr(-10, 10))

} else {

for (var e = r.split(/[\uD800-\uDBFF][\uDC00-\uDFFF]/), C = 0, h = e.length, f = []; h > C; C++)

“” !== e[C] && f.push.apply(f, a(e[C].split(“”))),

C !== h - 1 && f.push(o[C]);

var g = f.length;

g > 30 && (r = f.slice(0, 10).join(“”) + f.slice(Math.floor(g / 2) - 5, Math.floor(g / 2) + 5).join(“”) + f.slice(-10).join(“”))

}

var u = void 0

, l = “” + String.fromCharCode(103) + String.fromCharCode(116) + String.fromCharCode(107);

u = null !== i ? i : (i = window[l] || “”) || “”;

for (var d = u.split(“.”), m = Number(d[0]) || 0, s = Number(d[1]) || 0, S = [], c = 0, v = 0; v < r.length; v++) {

var A = r.charCodeAt(v);

128 > A ? S[c++] = A : (2048 > A ? S[c++] = A >> 6 | 192 : (55296 === (64512 & A) && v + 1 < r.length && 56320 === (64512 & r.charCodeAt(v + 1)) ? (A = 65536 + ((1023 & A) << 10) + (1023 & r.charCodeAt(++v)),

S[c++] = A >> 18 | 240,

S[c++] = A >> 12 & 63 | 128) : S[c++] = A >> 12 | 224,

S[c++] = A >> 6 & 63 | 128),

S[c++] = 63 & A | 128)

}

for (var p = m, F = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(97) + (“” + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(54)), D = “” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(51) + (“” + String.fromCharCode(94) + String.fromCharCode(43) + String.fromCharCode(98)) + (“” + String.fromCharCode(43) + String.fromCharCode(45) + String.fromCharCode(102)), b = 0; b < S.length; b++)

p += S[b],

p = n(p, F);

return p = n(p, D),

p ^= s,

0 > p && (p = (2147483647 & p) + 2147483648),

p %= 1e6,

p.toString() + “.” + (p ^ m)

}

💥运行结果


在这里插入图片描述

💥总结

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)

ykd-1713677529796)]

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值