requests库
常用方法
r = requests.get(url)
构造一个向服务器请求资源的Requests对象
返回一个包含服务器资源的Response对象
Response对象的属性
Requests库异常
理解Response异常
通用代码框架
import requests
def getHTMLText(url):
try:
r=requests.get(url,timeout=30)
r.raise_for_status()#如果状态不是200,引发HTTPEorror异常
r.encoding=r.apparent_encoding
return r.text
except:
return "产生异常"
if __name__=="__main__":
url="http://www.baidu.com"
print(getHTMLText(url))
HTTP协议
超文本传输协议
基于“请求与响应”模式的、无状态的应用层传输协议
请求与响应模式
用户发起请求,服务器作出响应
无状态
第一次和第二次请求之间没有相关关联
应用层协议
指的是该协议工作在TCP协议之上
http协议通常采用URL作为定位网络资源的标识
url格式
host:合法的Internet主机域名或IP地址
port: 端口号缺省端口为80
path:请求资源的路径每一个url对应着一段数据资源
HTTP协议对资源的操作
Requests库方法解析
requests.request(method,url,**kwargs)
method :请求方式,对应get put post等7种
url:拟获取页面的url链接
**kwargs:控制访问的参数 共13个
**kwargs介绍
重点
共以下13种
- requests.get(url,params=None,**kwargs)最常使用
- requests.head(url,**kwargs)
- requests.post(url,data=None,json=None,**kwargs)
- requests.put(url, data=None,**kwargs)
- requests.patch(url,data=None,**kwargs)
- requests.delete(url,**kwargs)