第二章 urllib数据挖掘(爬虫有道翻译及关于AttributeError: module 'urllib.request' has no attribute 'parse'的问题)

爬取有道,一开始运行以下代码出现了AttributeError: module ‘urllib.request’ has no attribute 'parse’的问题

from urllib import request
#import urllib.request as request
import urllib.parse
...
...
...

```python
data = request.parse.urlencode(formdata).encode(encoding='utf-8')

后来百度才知道request已经不是一个方法而是一个模块了,所以我们必须用导入模块的方法进行导入,

import urllib.request as request

而且parse是urllib里面的一个方法,所以直接urllib.parse就可以调用parse了。
下面直接附上正确的代码

import urllib.request as request#request作为模块导入
import urlli

#构造请求头,伪装成机器访问
然后打开有道翻译官网
在这里插入图片描述

header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763"}
key = input("请输入需要翻译的文字:")

我们开始查找请求正文
步骤如下:
在这里插入图片描述
在这里插入图片描述

fromdata={
"action":"FY_BY_REALTlME",
"bv":"908078567e4fa99e9a8b55bb7ca876a4",
"client":"fanyideskweb",
"doctype":"json",
"from":"AUTO",
"i":key,
"keyfrom":"fanyi.web",
"salt":15840040561109,
"sign":"28e7538ef947d7a398362bb9572267d5",
"smartresult":"dict",
"to":"AUTO",
"ts":"1584004056110",
"version":"2.1",
}

查找url
在这里插入图片描述注意为了躲避反爬,我们还需要把“_o"去掉

url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
#经过urlencode()对key转码
data = urllib.parse.urlencode(fromdata).encode(encoding="utf-8")
req = request.Request(url,data=data,headers= header)
response=request.urlopen(req).read()
print(response)

然后运行就会出现以下信息,说明成功了
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值