Requests库主要有七个主要的方法:
而我们爬虫一般用的主要是get()方法。其原理主要是:
Response对象包含服务器返回的所有信息,也包含请求的Request信息。其中Response对象主要包含以下属性信息,
requests.request(method, url, **kwargs)
**kwargs
: 控制访问的参数,共
13
个,均为可选项。以下为其列举:
params :
字典或字节序列,作为参数增加到
url
中
kv
=
{
'key1'
:
'value1'
,
'key2'
:
'value2'
}
r
=
requests
.
request
(
'GET'
,
'http://python123.io/ws'
,
params
=
kv
)
print(r.url)
http://python123.io/ws?key1=value1&key2=value2
data :
字典、字节序列或文件对象,作为
Request
的内容
json : JSON
格式的数据,作为
Request
的内容
headers :
字典,
HTTP
定制头
cookies :
字典或
CookieJar
,
Request
中的
cookie
auth :
元组,支持
HTTP
认证功能
files :
字典类型,传输文件
timeout :
设定超时时间,秒为单位
proxies :
字典类型,设定访问代理服务器,可以增加登录认证
allow_redirects : True/False
,默认为
True
,重定向开关
stream : True/False
,默认为
True
,获取内容立即下载开关
verify : True/False
,默认为
True
,认证
SSL
证书开关
cert :
本地
SSL
证书路径
应用:
requests.get(
url
,
params=None
,
**kwargs
)或其它提交方法。