利用Python3实现终端百度和谷歌翻译

最新推荐文章于 2024-08-08 08:10:46 发布

码路编

最新推荐文章于 2024-08-08 08:10:46 发布

阅读量1.3k

点赞数 1

分类专栏： Python

本文链接：https://blog.csdn.net/l2580258/article/details/84669328

版权

Python 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

利用Python3实现终端百度和谷歌翻译

1. Python调用Google翻译

最开始发现Google翻译居然用的Get方式请求的翻译数据，还暗自高兴了一波，这不简单吗？直接拼字符串就可以翻译了，还是我太天真?，待我把链接用requests请求之后，发现什么都没有，连个错误都不给我显示，跪了（备注：我开了全局VPN的，并非在墙之外）

最后看了别人的博客，才发现就是一个简单的链接，里面的tk参数是一个加密的算法，毕竟google翻译接口是要收费的?

好了，看来这个算法得抄别人的了，这个算法使用js实现的，估计是那个前端大佬需要在前端调用Google翻译做点事吧，所以需要在pyhon中调用js去获得tk。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NMIa7gwD-1578219456987)(https://ws4.sinaimg.cn/large/006tNbRwly1fxqgad9o6mj32j80na7g3.jpg)]

好了下面给出代码吧：

import requests
import json
import sys
import execjs  # 必须，需要先用pip install PyExecJS安装，用来执行js脚本


class Py4Js():
    def __init__(self):
        self.ctx = execjs.compile(""" 
    function TL(a) { 
    var k = ""; 
    var b = 406644; 
    var b1 = 3293161072;       
    var jd = "."; 
    var $b = "+-a^+6"; 
    var Zb = "+-3^+b+-f";    
    for (var e = [], f = 0, g = 0; g < a.length; g++) { 
        var m = a.charCodeAt(g); 
        128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charCodeAt(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charCodeAt(++g) & 1023), 
        e[f++] = m >> 18 | 240, 
        e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224, 
        e[f++] = m >> 6 & 63 | 128), 
        e[f++] = m & 63 | 128) 
    } 
    a = b; 
    for (f = 0; f < e.length; f++) a += e[f], 
    a = RL(a, $b); 
    a = RL(a, Zb); 
    a ^= b1 || 0; 
    0 > a && (a = (a & 2147483647) + 2147483648); 
    a %= 1E6; 
    return a.toString() + jd + (a ^ b) 
  };      
  function RL(a, b) { 
    var t = "a"; 
    var Yb = "+"; 
    for (var c = 0; c < b.length - 2; c += 3) { 
        var d = b.charAt(c + 2), 
        d = d >= t ? d.charCodeAt(0) - 87 : Number(d), 
        d = b.charAt(c + 1) == Yb ? a >>> d: a << d; 
        a = b.charAt(c) == Yb ? a + d & 4294967295 : a ^ d 
    } 
    return a 
  } 
 """)

    def getTk(self, text):
        return self.ctx.call("TL", text)


def buildUrl(text, tk):
    baseUrl = 'https://translate.google.cn/translate_a/single'
    baseUrl += '?client=t&'
    baseUrl += 's1=zh-CN&'
    baseUrl += 't1=en&'
    baseUrl += 'h1=zh-CN&'
    baseUrl += 'dt=at&'
    baseUrl += 'dt=bd&'
    baseUrl += 'dt=ex&'
    baseUrl += 'dt=ld&'
    baseUrl += 'dt=md&'
    baseUrl += 'dt=qca&'
    baseUrl += 'dt=rw&'
    baseUrl += 'dt=rm&'
    baseUrl += 'dt=ss&'
    baseUrl += 'dt=t&'
    baseUrl += 'ie=UTF-8&'
    baseUrl += 'oe=UTF-8&'
    baseUrl += 'otf=1&'
    baseUrl += 'pc=1&'
    baseUrl += 'ssel=0&'
    baseUrl += 'tsel=0&'
    baseUrl += 'kc=2&'
    baseUrl += 'tk=' + str(tk) + '&'
    baseUrl += 'q=' + text
    # print(baseUrl)
    return baseUrl


def translate(text):
    header = {
        'authority': 'translate.google.cn',
        'method': 'GET',
        'path': '',
        'scheme': 'https',
        'accept': '*/*',
        'accept-encoding': 'gzip, deflate, br',
        'accept-language': 'zh-CN,zh;q=0.9',
        'cookie': '',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64)  AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
        'x-client-data': 'CIa2yQEIpbbJAQjBtskBCPqcygEIqZ3KAQioo8oBGJGjygE='
    }
    url = buildUrl(text, js.getTk(text))
    res = ''
    try:
        r = requests.get(url)
        result = json.loads(r.text)
        if result[7] != None:
            # 如果我们文本输错，提示你是不是要找xxx的话，那么重新把xxx正确的翻译之后返回
            try:
                correctText = result[7][0].replace('<b><i>', ' ').replace('</i></b>', '')
                print(correctText)
                correctUrl = buildUrl(correctText, js.getTk(correctText))
                correctR = requests.get(correctUrl)
                newResult = json.loads(correctR.text)
                res = newResult[0][0][0]
            except Exception as e:
                print(e)
                res = result[0][0][0]

        else:
            res = result[0][0][0]
    except Exception as e:
        res = ''
        print(url)
        print("翻译" + text + "失败")
        print("错误信息:")
        print(e)
    finally:
        return res


if __name__ == '__main__':
    text = ''
    for item in range(1, len(sys.argv)):
        text += sys.argv[item] + " "
    js = Py4Js()
    res = translate(text)
    print(res)

2. Python调用百度翻译

虽然我一直觉得Google负责提高人类智商上限，百度负责挑战人类底线，但是在大天朝，还是离不开百度的，毕竟我们都是墙内的孩子呢。

百度翻译比较简单，还自带文本检测的API，所以我的代码就可以实现输入中文翻译为英文，反之亦然。

而且语言检测的API调用也很简单

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-o4S7d5Bs-1578219456988)(https://ws1.sinaimg.cn/large/006tNbRwly1fxqenbgynbj31t807o0v5.jpg)]

直接将文本post请求一波就可以了

好了下面来说百度的翻译接口，百度的翻译接口，也是需要AppID和SecretKey的，不过还好，每个月200万条以内免费，需要注册成为百度翻译的开发者

下面是代码：

import requests
import json
import random
import hashlib
import sys

class BaiduTranslate(object):
    def __init__(self, text):
        self.text = text
        self.params = {'query': text}
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'}
        pass

    def langdetect(self):
        url = 'https://fanyi.baidu.com/langdetect'
        response = requests.post(url, headers=self.headers, params=self.params)
        res = json.loads(response.content.decode())
        return res['lan']

    def translate(self):
        appid = '20151113000005349'
        secretKey = 'osubCEzlGjzvw8qdQc41'
        q = self.text
        from_lang = self.langdetect()
        if from_lang == 'en':
            to_lang = 'zh'
        else:
            to_lang = 'en'
        salt = random.randint(32768, 65536)
        sign = appid + q + str(salt) + secretKey
        sign = hashlib.md5(sign.encode()).hexdigest()
        url = 'http://fanyi-api.baidu.com/api/trans/vip/translate?appid=' + appid + '&q=' + q + '&from=' + from_lang + '&to=' + to_lang + '&salt=' + str(
            salt) + '&sign=' + sign
        response = requests.post(url, headers=self.headers)
        res = json.loads(response.content.decode())
        # print(res)
        print(res['trans_result'][0]['dst'])


if __name__ == '__main__':
    text = ''
    for item in range(1, len(sys.argv)):
        text += sys.argv[item] + " "
    baidu_translate = BaiduTranslate(text)
    baidu_translate.translate()

是不是很简单，确实很简单?

3. 添加到终端（terminal）

对了，要先执行前面的python文件，需要先用pip安装两个库

pip install requests
pip install PyExecJS

好了，上面已经说了把具体的代码说了，下面就是如何添加到终端并设置别名，我使用的是MAC，如果没有安装zsh的话，修改.bashrc，否则修改.zshrc文件（一定是根目录下的.zshrc文件哈）将下面两句添加到最后

alias fyg="python3 /Users/liuyao/MyProjects/PythonTools/google_fanyi.py"
alias fyb="python3 /Users/liuyao/MyProjects/PythonTools/baidu_fanyi.py"

alias是设置别名，fyg(b)是具体的别名，python3是使用运行条件，后面的就是具体的文件路径

最后source使之生效

 source ~/.zshrc

对于Windows的话，稍微有点麻烦，具体可参见在cmd中为命令设置别名以及启动cmd时自动执行bat，但花点时间还是值得的?

4.测试

由于Google的tk算法，对中文翻译为英文还是有点问题，所以现在就只能使用Google英译中

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FE5MNopj-1578219456988)(https://ws3.sinaimg.cn/large/006tNbRwly1fxqg65x4tsj30hg0aitb0.jpg)]

当然也是可以翻译句子的：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oL2akdv9-1578219456989)(https://ws1.sinaimg.cn/large/006tNbRwly1fxqgmggyf2j30ts0a442x.jpg)]

完工?

具体文件可以通过Github去获得

在这里插入图片描述

码路编

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录