有道翻译 爬虫 讲解 和 代码

好久没写过关于爬虫的的文章了 现在针对于爬虫大部分涉及到js 加密 我写一个简单的关于js问题 有道翻译 这涉及js简单的加密 现在我给大家简单简述 这个流程 如下图所示 图一中的 data中这几个字段 肯定猜想是加密了 然后 复制sign字段 找到js 相关代码 图二 中的方法 然后得到数据 断点调试 得到想要的猜想数据 … 代码如下:

在这里插入图片描述

在这里插入图片描述

#!/usr/bin/python3.7
# -*- coding: utf-8 -*-
# @Author  : Monkey
# @Software: PyCharm
# @Time    : 2021/3/3116:43
# @File    : youdao.py
# @Software: PyCharm
#                                  _oo8oo_
#                                 o8888888o
#                                 88" . "88
#                                 (| -_- |)
#                                 0\  =  /0
#                               ___/'==='\___
#                             .' \\|     |# '.
#                            / \\|||  :  |||# \
#                           / _||||| -:- |||||_ \
#                          |   | \\\  -  #/ |   |
#                          | \_|  ''\---/''  |_/ |
#                          \  .-\__  '-'  __/-.  /
#                        ___'. .'  /--.--\  '. .'___
#                     ."" '<  '.___\_<|>_/___.'  >' "".
#                    | | :  `- \`.:`\ _ /`:.`/ -`  : | |
#                    \  \ `-.   \_ __\ /__ _/   .-` /  /
#                =====`-.____`.___ \_____/ ___.`____.-`=====
#                                  `=---=`
#
#
#               ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
#
#                          佛祖保佑         永不宕机/永无bug
import hashlib
import time
import random
import requests

headers={
    'Cookie': 'OUTFOX_SEARCH_USER_ID=-2006006658@10.108.160.17; OUTFOX_SEARCH_USER_ID_NCOO=637053778.397833; UM_distinctid=174569dbd3e165-064df79033d73e-f7b1332-144000-174569dbd3f4e1; P_INFO=13738726398|1599483534|1|youdaodict|00&99|null&null&null#gud&440400#10#0|&0|null|13738726398; DICT_PERS=v2|urs-phone-web||DICT||web||604800000||1599483535136||223.73.72.95||urs-phoneyd.4f432dfaa2aa42039@163.com||JFRfzA6LqS0JzhMqu6MYW0k5OfQLOLqu0k5hHYGO4gBRlAhLwLhLPBRPy6MzWO4P4RQZhMgShHgz0qBhfeBRHOM0; JSESSIONID=aaakOLhlG98n3_GHGYTrx; DICT_SESS=v2|l_MaOezpZ0k5kfJuO4PLRk5Rfp4k4eLRTB0LJF0MJLRPuRLPBn4Ul0pL0MTFOfzm0UG0MkfkMPy0pFhHJBRfq40lfPLOWOfUG0; DICT_LOGIN=3||1599569791389; ___rl__test__cookies=1599569917583',
    'Origin': 'http://fanyi.youdao.com',
    'Referer': 'http://fanyi.youdao.com/',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
ua="5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36"
def func(word):
    r = str(int(time.time()*1000))
    t=hashlib.md5(ua.encode('utf-8')).hexdigest()
    i=str(int(r)+random.randint(0,9))
    return {
        'ts': r,
        'bv': t,
        'salt': i,
        'sign': hashlib.md5(("fanyideskweb" + word + i + "Tbh5E8=q6U3EXe+&L[4c@").encode('utf-8')).hexdigest()
    }

def data(word):
    r=func(word)
    return{
    'i': word,
    'from': 'AUTO',
    'to': 'AUTO',
    'smartresult': 'dict',
    'client': 'fanyideskweb',
    'salt': r['salt'],
    'sign':r['sign'],
    'lts': r['ts'],
    'bv': r['bv'],
   'doctype': 'json',
    'version': '2.1',
   'keyfrom': 'fanyi.web',
    'action': 'FY_BY_CLICKBUTTION'
    }
def run():
    url ="http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule"
    Word = input()
    if (Word=="q"):
        exit()
    response = requests.post(url, headers=headers, data=data(Word))
    # print(response.text)
    try:
        content = response.json()['translateResult'][0][0]
        sentences = response.json()['translateResult'][0]
        src = content['src']
        if response.json()['smartResult']:
            means = response.json()['smartResult']['entries']
            print(f"\n\n查询:{src}\n翻译内容为:")
            for i in means[1:]:
                print("\t",i,end="")
            print("\n\n")
    except:
        try:
            print("\n\n")
            for sentence in sentences:
                print(f"查询:{sentence['src']}\n翻译内容为:{sentence['tgt']}")
            print("\n\n")
        except:
            print("\n\n不存在该单词\n\n")
if __name__ =="__main__":
    print("*" * 50)
    print("如果 退出请输入q")
    print("*" * 25)
    while(True):
        print("输入需要翻译的文字:", end="")
        run()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值