之前学过urllib,但在实现功能时有些比较复杂,比如处理网页验证的cookies时,需要写opener和handle来处理。为了更加方便的实现这些操作,这就有了更为强大的库request,有了它,cookies、登录验证、代理设置等操作都不是事。
加载库:
import requests
1.实现get请求(还有其他参数后面介绍)
r = requests.get('http://baidu.com')
1.1 实例化对象r的一些方法:
type(r) # 实例化对象的类型:requests.models.Response
r.status_code # 状态码
type(r.text) # 响应体为str格式(有时是JSON格式,JSON = str(字典)则需要用json()方法转换为字典)
r.text # 响应体(返回的网页,后续提取网页信息)
r.cookies # 得到cookies
r.headers # 获取响应头
r.url # 获取URL
r.history
1.2 除了get请求外,类似的实现其他请求(还有其他参数后面介绍)
r = requests.post('http://httpbin.org/post')
r = requests.put('http://httpbin.org/put')
r = requests.delete('http://httpbin.org/delete')
r = requests.head('http://httpbin.org/get')
r = requests.options('http://httpbin.org/get')
1.3 在get请求中加入一些参数(等于加在网址上)
data = {
'name':'daguo',
'age':'23'
} # 添加get信息,相当于在url后附加:http://httpbin.org/get?age=22&name=daguo
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
} # 添加请求头
r