Python网络爬虫（2）- 爬虫翻译程序-含有道、金山、百度翻译

最新推荐文章于 2024-06-22 14:38:57 发布

Howie_Yue

最新推荐文章于 2024-06-22 14:38:57 发布

阅读量5.1k

点赞数 5

分类专栏： Pyhon 爬虫文章标签： python post 爬虫

本文链接：https://blog.csdn.net/qq_34175893/article/details/79735912

版权

本文介绍了Python网络爬虫实现翻译的功能，包括有道、金山和百度翻译。重点在于获取POST表单数据并处理不同网站的表单属性变化。2.0版本新增了金山和百度的翻译，并对结果进行比较。注意，百度翻译目前仅支持英译中，且其API使用较为复杂。

摘要由CSDN通过智能技术生成

1.0 版本

#首先贴上结果，自动检测语言

对于这种需要提交数据的爬虫，最主要的就是获取form data了，具体的获取方式请参考

如何通过Chrome获取post表单数据

这里需要注意的是，同一个网站的表单的属性名可能会有变化，自己使用的时候需要注意，否则可能会导致结果不对，或者乱码什么的。

下面是基于python3.6.1版本的程序

# -*- coding: UTF-8 -*-
from urllib import request
from urllib import parse
import json

if __name__ == "__main__":
    #Request URL
    Request_URL = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
    #创建Form_Data字典，存储得到的Form Data
    Form_Data = {}
    Form_Data['type'] = 'AUTO'
    Form_Data['from'] = 'AUTO' #自动检测语言
    Form_Data['to'] = 'AUTO'
    Form_Data['smartresult'] = 'dict'
    Form_Data['doctype'] = 'json'
    Form_Data['version'] = '2.1'
    Form_Data['keyfrom'] = 'fanyi.web'
    Form_Data['action'] = 'FY_BY_REALTIME'
    #使用urlencode方法转换标准格式
    while 1:
        Form_Data['i'] = input("请输入要翻译的内容:")
        if Form_Data['i'].lower()=='exit':
            print('已退出')
            exit(0)
        data = parse.urlencode(Form_Data).encode('utf-8')
        #传递Request对象和转换完格式的数据
        response = request.urlopen(Request_URL,data)
        #读取信息并解码
        html = response

最低0.47元/天解锁文章

Howie_Yue

关注

5
点赞
踩
21

收藏

觉得还不错? 一键收藏
4
评论
Python网络爬虫（2）- 爬虫翻译程序-含有道、金山、百度翻译

1.0 版本#首先贴上结果，自动检测语言对于这种需要提交数据的爬虫，最主要的就是获取form data了，具体的获取方式请参考如何通过Chrome获取post表单数据这里需要注意的是，同一个网站的表单的属性名可能会有变化，自己使用的时候需要注意，否则可能会导致结果不对，或者乱码什么的。下面是基于python3.6.1版本的程序# -*- coding: UTF-8 -...
复制链接

扫一扫

专栏目录