python爬虫高级教程，JS逆向之百度翻译

最新推荐文章于 2024-04-27 17:30:34 发布

VIP文章 Python_sn

最新推荐文章于 2024-04-27 17:30:34 发布

阅读量606

点赞数 2

文章标签： python 编程语言 Python爬虫网络爬虫

本文链接：https://blog.csdn.net/Python_sn/article/details/109730791

版权

环境

python版本号	系统	游览器
python 3.7.2	win7	google chrome

关于本文

本文将会通过爬虫的方式实现简单的百度翻译。本文中的代码只供学习，不允许作为于商务作用。商务作用请前往api.fanyi.baidu.com购买付费的api。若有侵犯，立即删文！

很多人学习python，不知道从何学起。
很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。
很多已经做案例的人，却不知道如何去学习更加高深的知识。
那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！??¤
QQ群：704929215

实现思路

在网站文件中找到隐藏的免费api。传入api所需要的参数并对其发出请求。在返回的json结果里找到相应的翻译结果。

百度翻译的反爬机制

由js算法生成的sign
cookie检测
token暗号

在网站文件中找到隐藏的免费api

进入百度翻译，随便输入一段需要翻译的文字。当翻译结果出来的时候，按下F12，选择到NETWORK，最后点进XHR文件。这个时候，网站文件都已经加载完了，所以要F5刷新一下。

刷新了之后，我们就能发现一个以v2transapi?开头的文件，没错，它就是我们要找的api接口。让我们验证一下，点进去文件-preview，我们就可以在json格式的数据里面找到翻译结果，验证成功。

另外，我们还需要获取我们的cookie和token，在之后的反爬机制中我们需要用到它们，位置如以下。

cookie位置：

token位置：

api信息

接口： https://fanyi.baidu.com/v2tra...

请求方式：post

请求参数大全

参数	介绍
from	源语言
to	目标语言
query	翻译文本
sign	由js算法生成的签名（反爬）
token	请求暗号

开始写代码

导入request和execjs库

import requests
import execjs

requests HTTP库，用于爬虫
execjs 用于调用js代码

反反爬虫

由于百度翻译有cookie识别反爬机制，所以我们设置好我们刚刚获取到的cookie来进行掩护网络蜘蛛身份。

headers = {'cookie':'请在这里输入你的cookie'}

另外，我们还要设置好token（暗号）。

token = '请在这里放置你的token'

最后只剩下sign反爬机制了，sign是由js算法给译文生成的一个签名。我在网上搜了一下，找到了相应的js算法，分享给大家。

var i = "320305.131321201"
function n(r, o) {
    for (var t = 0; t < o.length - 2; t += 3) {
        var a = o.charAt(t + 2);
        a = a >= "a" ? a.charCodeAt(0) - 87 : Number(a), a = "+" === o.charAt(t + 1) ? r >>> a : r << a, r = "+" === o.charAt(t) ? r + a & 4294967295 : r ^ a
    }
    return r
}
 
 
function e(r) {
    var o = r.match(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g);
    if (null === o) {
        var t = r.length;
        t > 30 && (r = "" + r.substr(0, 10) + r.substr(Math.floor(t / 2) - 5, 10)

最低0.47元/天解锁文章

Python_sn

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python爬虫高级教程，JS逆向之百度翻译

环境python版本号系统游览器 python 3.7.2 win7 google chrome 关于本文本文将会通过爬虫的方式实现简单的百度翻译。本文中的代码只供学习，不允许作为于商务作用。商务作用请前往api.fanyi.baidu.com购买付费的api。若有侵犯，立即删文！很多人学习python，不知道从何学起。很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。很多已经做案例的人，却不知道如何去学习更加高深的知识。那么针对这三
复制链接

扫一扫