7个主要方法
requests.request() 构造一个请求支持以下方法
requests.get() 获取html主页
requests.head() 获取网页头信息
request.post() 向网页提交post请求
requests.put() 向网页提交put请求
requests.patch() 向网页提交修改请求
requests.delete() 向网页提交删除请求
requests.get(url链接,url中的额外参数 字典或字节流格式,
**kwargs12个控制访问的参数)
response 的编码
r.encoding:如果header中不存在charset,则认为编码为ISO-8859-1
r.text根据r.encoding 显示网络内容
r.apparent_encoding:根据网页内容分析出的编码方式 是encoding的备选
requestso库的异常
ConnectionError 网络连接诶错误异常
HTTPError http错误
URLRequired URL缺失异常
TooManyRedirects 超过最大重定向次数
ConnectionTimeout 连接远程服务器超时
Timeout 请求URL超时
reaise_for_status()判断是否返回值为200.不是200就是404异常
实例关于爬搜狐
import requests
def getHTMLText(url):
try:
r= requests.get(url,timeout=30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return "产生异常"
if __name__ =="__main__":
url="http://m.sohu.com"
print(getHTMLText(url))
`
![在这里插入图片描述](https://img-blog.csdnimg.cn/1d199e5f41254ad99bf7e1d35bbcb09f.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5aSp5aSp5byA5b-DNzc4ODY2NTU0NA==,size_15,color_FFFFFF,t_70,g_se,x_16#pic_center)