我们可以利用urlopen()方法可以实现最基本请求的发起,但这几个简单的参数并不足以
构建一个完整的请求,如果请求中需要加入headers(请求头)等信息,我们就可以利用
更强大的Request类来构建一个请求。也许这就是一下两个方式的区别吧:
respponse = urllib.request.urlopen(url)
req = urllib.request.Request(url)
response = urllib.request.urlopen(req)
#用Request类构建了一个完整的请求,增加了headers等一些信息
import urllib.request
import urllib.parse
url = 'http://httpbin.org/post'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
headers['Host'] = 'httpbin.org'
dict = {'name':'Germey'}
data = urllib.parse.urlencode(dict).encode('utf-8')
#data参数如果要传必须传bytes(字节流)类型的,如果是一个字典,先用urllib.parse.urlencode()编码。
request = urllib.request.Request(url = url,data = data,headers = headers,method = 'POST')
response = urllib.request.urlopen(request)
html = response.read().decode('utf-8')
print(html)
第二种设置urllib.request.Request中data,headers以及method的方法:
req = urllib.request.Request(url=url,data=data,method='POST')
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')