牢饭少不了(python爬虫学习笔记)——Requests库

这篇博客介绍了通过北京理工大学嵩天老师的慕课学习Python基础,特别是《Python语言程序设计》和《Python网络爬虫与信息提取》课程。文章详细讲解了requests库的各种方法,如get、post、put、patch和delete,以及常用参数的用法,包括params、data、json、headers等,适合初学者掌握Python网络爬虫的基本操作。
摘要由CSDN通过智能技术生成

我是通过学习北京理工大学嵩天老师的慕课《python语言程序设计》来学习python基础的,课程设计是讲完理论就会伴随一到两个示例,我比较喜欢这种方式。

学习《python语言程序设计》前四周课程之后,就可以学一些《Python网络爬虫与信息提取》的内容。

强烈推荐嵩天老师的慕课

《python语言程序设计》:Python语言程序设计_北京理工大学_中国大学MOOC(慕课) (icourse163.org)

《Python网络爬虫与信息提取》:Python网络爬虫与信息提取_北京理工大学_中国大学MOOC(慕课) (icourse163.org)

笔记记录:

#requests库

# requests.request()      构造一个请求,支持以下各方法的基础方法
# requests.get()          获取HTML网页的主要方法,对应HTTP的GET
# requests.head()         获取HTML网页头信息的方法,对应HTTP的HEAD
# requests.post()         向HTML网页提交POS请求的方法,对应HTTP的POST
# requests.put()          向HTML网页提交PUT请求的方法,对应HTTP的POST
# requests.patch()        向HTML网页提交局部修改请求,对应HTTP的PSTCH
# requests.delete()       向HTML页面提交删除请求,对应HTTP的DELETE

# requests.request(method,url,**kwargs) 
#    method包括 HTTP协议中GET HEAD POST等
#    url就是访问的网址
#    **kwargs (共13个参数)

# **kwargs 13个参数
#    常用4个:
#    params:字典或字节序列,作为参数增加到URL中
#    data:字典、字节序列或文件对象,作为request的内容
#    json:JSON格式的数据,作为Request的内容
#    headers:字典,HTTP的协议头。可以利用这个字段定制访问某个url的http的协议头

#    cookies:字典或CookieJar,Request中的cookie
#    auth:元组,支持HTTP认证功能
#    files:字典类型,传输文件,向某一个链接提交文件
#    timeout:设定超时时间,秒为单位
#    proxies:字典类型,设定访问代理服务器,可以增加登录认证(有效防止对爬虫的逆追踪)
#    allow_redirects:True/False,默认为True,重定向开关
#    stream:True/False,默认为True,获取内容是否立即下载的开关
#    verify:True/False,默认为True,认证SSL证书开关
#    cert:保存本地SSL证书路径


# requests.get(url,params=None,**kwargs)  ——>最常用的方法 
#    url:拟获取页面的url链接
#    params:url中的额外参数,字典或字节流格式,可选
#    **kwargs:12个控制访问的参数(除request中的params的其他12个字段)

# requests.post(url,data=None,json=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件,Request的内容
#    json:JSON格式的数据,Request的内容
#    **kwargs:11个控制访问的参数(除上面两个参数以外的其他11个字段)

# requests.put(url,data=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件,Request的内容
#    **kwargs:12个控制访问的参数(除上面一个参数以外的其他12个字段)

# requests.patch(url,data=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件,Request的内容
#    **kwargs:12个控制访问的参数(除上面一个参数以外的其他12个字段)

# requests.put(url,**kwargs)
#    url:拟删除页面的url链接
#    data:字典、字节序列或文件,Request的内容
#    **kwargs:13个控制访问的参数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值