try:
r=requests.get(url timeout=30)requests.request(method,url,**kwargs)
method:请求方式,对应get/put/post等七种
url:获取页面的链接
**kwargs:控制访问的参数,均为可选项】
params:字典或字节序列,作为参数增加到url中
data:字典、字节序列或文件对象,可作为Requests的内容
json:JSON格式数据,作为Requests的内容
headers::字典,HTTP定制头
cooki:字典或CookieJar,Requests中的cookie
auth:元组,支持HTTP认证功能
files:字典类型,传输文件
timeout:设定超时时间,秒为单位
proxies:字典类型,设定访问代理服务器,可以增加登录认证(隐藏原ip地址的信息,防止逆追踪)
allow_redirects:True/False;默认是True,重定向开关
stream:默认是True,获取内容立即下载开关
verify:True/False 默认是True,认证SSL证书开关
cert:本地SSL证书路径
单元小结
爬取网页的通过代码框架
r.raise_for_status() 如果返回有异常就不是200 ,会except
r.encoding=r.apparent_encoding
return r.text
except:
return "产生异常"
网络连接有风险