有道翻译爬虫讲解和代码

最新推荐文章于 2024-04-18 11:22:38 发布

Hou_Monkey

最新推荐文章于 2024-04-18 11:22:38 发布

阅读量595

点赞数

分类专栏：爬虫文章标签： python json

本文链接：https://blog.csdn.net/hou9876543210/article/details/117655013

版权

爬虫专栏收录该内容

15 篇文章 4 订阅

订阅专栏

好久没写过关于爬虫的的文章了现在针对于爬虫大部分涉及到js 加密我写一个简单的关于js问题有道翻译这涉及js简单的加密现在我给大家简单简述这个流程如下图所示图一中的 data中这几个字段肯定猜想是加密了然后复制sign字段找到js 相关代码图二中的方法然后得到数据断点调试得到想要的猜想数据 … 代码如下：

在这里插入图片描述

#!/usr/bin/python3.7
# -*- coding: utf-8 -*-
# @Author  : Monkey
# @Software: PyCharm
# @Time    : 2021/3/3116:43
# @File    : youdao.py
# @Software: PyCharm
#                                  _oo8oo_
#                                 o8888888o
#                                 88" . "88
#                                 (| -_- |)
#                                 0\  =  /0
#                               ___/'==='\___
#                             .' \\|     |# '.
#                            / \\|||  :  |||# \
#                           / _||||| -:- |||||_ \
#                          |   | \\\  -  #/ |   |
#                          | \_|  ''\---/''  |_/ |
#                          \  .-\__  '-'  __/-.  /
#                        ___'. .'  /--.--\  '. .'___
#                     ."" '<  '.___\_<|>_/___.'  >' "".
#                    | | :  `- \`.:`\ _ /`:.`/ -`  : | |
#                    \  \ `-.   \_ __\ /__ _/   .-` /  /
#                =====`-.____`.___ \_____/ ___.`____.-`=====
#                                  `=---=`
#
#
#               ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
#
#                          佛祖保佑         永不宕机/永无bug
import hashlib
import time
import random
import requests

headers={
    'Cookie': 'OUTFOX_SEARCH_USER_ID=-2006006658@10.108.160.17; OUTFOX_SEARCH_USER_ID_NCOO=637053778.397833; UM_distinctid=174569dbd3e165-064df79033d73e-f7b1332-144000-174569dbd3f4e1; P_INFO=13738726398|1599483534|1|youdaodict|00&99|null&null&null#gud&440400#10#0|&0|null|13738726398; DICT_PERS=v2|urs-phone-web||DICT||web||604800000||1599483535136||223.73.72.95||urs-phoneyd.4f432dfaa2aa42039@163.com||JFRfzA6LqS0JzhMqu6MYW0k5OfQLOLqu0k5hHYGO4gBRlAhLwLhLPBRPy6MzWO4P4RQZhMgShHgz0qBhfeBRHOM0; JSESSIONID=aaakOLhlG98n3_GHGYTrx; DICT_SESS=v2|l_MaOezpZ0k5kfJuO4PLRk5Rfp4k4eLRTB0LJF0MJLRPuRLPBn4Ul0pL0MTFOfzm0UG0MkfkMPy0pFhHJBRfq40lfPLOWOfUG0; DICT_LOGIN=3||1599569791389; ___rl__test__cookies=1599569917583',
    'Origin': 'http://fanyi.youdao.com',
    'Referer': 'http://fanyi.youdao.com/',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
ua="5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36"
def func(word):
    r = str(int(time.time()*1000))
    t=hashlib.md5(ua.encode('utf-8')).hexdigest()
    i=str(int(r)+random.randint(0,9))
    return {
        'ts': r,
        'bv': t,
        'salt': i,
        'sign': hashlib.md5(("fanyideskweb" + word + i + "Tbh5E8=q6U3EXe+&L[4c@").encode('utf-8')).hexdigest()
    }

def data(word):
    r=func(word)
    return{
    'i': word,
    'from': 'AUTO',
    'to': 'AUTO',
    'smartresult': 'dict',
    'client': 'fanyideskweb',
    'salt': r['salt'],
    'sign':r['sign'],
    'lts': r['ts'],
    'bv': r['bv'],
   'doctype': 'json',
    'version': '2.1',
   'keyfrom': 'fanyi.web',
    'action': 'FY_BY_CLICKBUTTION'
    }
def run():
    url ="http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule"
    Word = input()
    if (Word=="q"):
        exit()
    response = requests.post(url, headers=headers, data=data(Word))
    # print(response.text)
    try:
        content = response.json()['translateResult'][0][0]
        sentences = response.json()['translateResult'][0]
        src = content['src']
        if response.json()['smartResult']:
            means = response.json()['smartResult']['entries']
            print(f"\n\n查询:{src}\n翻译内容为:")
            for i in means[1:]:
                print("\t",i,end="")
            print("\n\n")
    except:
        try:
            print("\n\n")
            for sentence in sentences:
                print(f"查询:{sentence['src']}\n翻译内容为:{sentence['tgt']}")
            print("\n\n")
        except:
            print("\n\n不存在该单词\n\n")
if __name__ =="__main__":
    print("*" * 50)
    print("如果 退出请输入q")
    print("*" * 25)
    while(True):
        print("输入需要翻译的文字:", end="")
        run()

Hou_Monkey

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
有道翻译爬虫讲解和代码

好久没写过关于爬虫的的文章了现在针对于爬虫大部分涉及到js 加密我写一个简单的关于js问题有道翻译这涉及js简单的加密现在我给大家简单简述这个流程如下图所示图一中的 data中这几个字段肯定猜想是加密了然后复制sign字段找到js 相关代码图二中的方法然后得到数据断点调试得到想要的猜想数据 … 代码如下：#!/usr/bin/python3.7# -*- coding: utf-8 -*-# @Author : Monkey# @Software: PyC
复制链接

扫一扫