requests模块的使用
1、发送get请求
url = "http://httpbin.org/get"
r=requests.get(url)
如果需要传递参数可以有以下几种方法:
方法1:
url = "http://httpbin.org/get?name=%s"%('fasfasf')
r=requests.get(url)
方法2:
r=requests.get("http://httpbin.org/get?key1=value1&key2=value2")
方法3:
payload = {‘key1‘: ‘value1‘, ‘key2‘: ‘value2‘}
r=requests.get("https://httpbin.org/get",params=payload)
其中里面的值也可以是这样的:
payload = {‘key1‘: ‘value1‘, ‘key2‘: [‘value2‘, ‘value3‘]}
相当于访问url:https://httpbin.org/get?key1=value1&key2=value2&key2=value3
2、定制请求头:模拟浏览器请求
headers={‘user-agent‘: ‘my-app/0.0.1‘}
r=requests.get("https://api.github.com/some/endpoint",headers=headers)
3、读取内容:
如果是读取非文本数据,可以使用r.content来读取二进制数据。
如果需要读取网页内容,可以使用r.text,Requests会基于Http头部进行对编码推测,并选择合适的解码方式。
你可以使用r.encoding来查看编码方式,如果返回的网页内容出现了乱码,可以通过查看r.content的头部编码来修改r.encoding的值重新进行r.text的提取,这样就会得到正确的内容了。
r=requests.get("http://httpbin.org/get?key1=value1&key2=value2"),
print(r.encoding)#可以查看出Requests推测的内容编码方式
r.encoding="UTF-8" #通过查看网页的编码方式来修改r.encoding
print(r.text)#以文本的形式输出响应的结果
4、处理json数据:
Requests内部有一个json解码器,能够帮你处理json数据;json是一种轻量级的数据交换格式
r=requests.get("https://api.github.com/events")
t=r.json()
5、发送POST请求:
发送post请求需要添加data,
data可以是dict类型,也可以是str类型,也可以是元祖类型
payload = ((‘key1‘, ‘value1‘), (‘key1‘, ‘value2‘))
r = requests.post(‘https://httpbin.org/post‘, data=payload)
print(r.text)
6、响应状态码:r.status_code
来查看响应状态码;响应状态码是表示是否成功访问。一般正常是200
响应头:r.headers
查看响应cookies:r.cookies
查看响应地址:r.url
7、session联网会话请求
sess = requests.session()
r = sess.get(url=url,cookies= cookies)
8、requests使用代理请求&请求超时设置
r= requests.get(url,proxies={'协议名称如http':'代理地址:端口号'},timeout=20)#请求20秒后显示超时