通过有道翻译爬虫可以在python中进行翻译,得到翻译结果,在爬虫初学阶段,有道翻译是比较简单易于尝试。
爬虫的思路:
1、获取url(网址)。2、发出请求,获得响应。3、提取数据。4、保存数据。
具体代码及步骤:
- 导入需要使用的库,通过import导入库,就可以使用库里的函数
import urllib.request
import urllib.parse
import json
urllib库:是python的内置请求库,常用于网页的请求访问。
包括以下模块:
urllib.request 请求模块
urllib.error 异常处理模块
urllib.parse url解析模块
- 在网页中获取需要的数据
1.打开有道翻译 - 尝试输入一个词 - 右键检查 - network
可以看到有post和get,这是客户端和服务器进行请求和响应最常用的两种方法。post是提交数据,get是获得数据。
2.进入一个post - Headers
找到url就可以向服务器发送请求
- 获得响应
核心语句就是
response=urllib.request.urlopen(url,data)
接着在网页中找到From Data和URL的内容复制进去
import urllib.request
import urllib.parse
url='http://fanyi.youdao.com/translate'
data={
}
data['i'] = 'hello'
data['type'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '15954759572511'
data['sign'] = '7d532782c7fa6f7846a42d0e7cfae962'
data['ts'] = '1595475957251'
data['bv'] = '901200199a98c590144a961dac532964'
data