牢饭少不了（python爬虫学习笔记）——Requests库_python敲的好牢饭少不了-CSDN博客

本文链接：https://blog.csdn.net/weixin_52545228/article/details/119737828

这篇博客介绍了通过北京理工大学嵩天老师的慕课学习Python基础，特别是《Python语言程序设计》和《Python网络爬虫与信息提取》课程。文章详细讲解了requests库的各种方法，如get、post、put、patch和delete，以及常用参数的用法，包括params、data、json、headers等，适合初学者掌握Python网络爬虫的基本操作。

摘要由CSDN通过智能技术生成

我是通过学习北京理工大学嵩天老师的慕课《python语言程序设计》来学习python基础的，课程设计是讲完理论就会伴随一到两个示例，我比较喜欢这种方式。

学习《python语言程序设计》前四周课程之后，就可以学一些《Python网络爬虫与信息提取》的内容。

《Python网络爬虫与信息提取》：Python网络爬虫与信息提取_北京理工大学_中国大学MOOC(慕课) (icourse163.org)

笔记记录：

#requests库

# requests.request()      构造一个请求，支持以下各方法的基础方法
# requests.get()          获取HTML网页的主要方法，对应HTTP的GET
# requests.head()         获取HTML网页头信息的方法，对应HTTP的HEAD
# requests.post()         向HTML网页提交POS请求的方法，对应HTTP的POST
# requests.put()          向HTML网页提交PUT请求的方法，对应HTTP的POST
# requests.patch()        向HTML网页提交局部修改请求，对应HTTP的PSTCH
# requests.delete()       向HTML页面提交删除请求，对应HTTP的DELETE

# requests.request(method,url,**kwargs) 
#    method包括 HTTP协议中GET HEAD POST等
#    url就是访问的网址
#    **kwargs （共13个参数）

# **kwargs 13个参数
#    常用4个：
#    params:字典或字节序列，作为参数增加到URL中
#    data:字典、字节序列或文件对象，作为request的内容
#    json:JSON格式的数据，作为Request的内容
#    headers:字典，HTTP的协议头。可以利用这个字段定制访问某个url的http的协议头

#    cookies:字典或CookieJar，Request中的cookie
#    auth:元组，支持HTTP认证功能
#    files:字典类型，传输文件，向某一个链接提交文件
#    timeout:设定超时时间，秒为单位
#    proxies:字典类型，设定访问代理服务器，可以增加登录认证（有效防止对爬虫的逆追踪）
#    allow_redirects:True/False,默认为True，重定向开关
#    stream:True/False，默认为True，获取内容是否立即下载的开关
#    verify:True/False，默认为True，认证SSL证书开关
#    cert:保存本地SSL证书路径


# requests.get(url,params=None,**kwargs)  ——>最常用的方法 
#    url:拟获取页面的url链接
#    params:url中的额外参数，字典或字节流格式，可选
#    **kwargs:12个控制访问的参数（除request中的params的其他12个字段）

# requests.post(url,data=None,json=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件，Request的内容
#    json:JSON格式的数据，Request的内容
#    **kwargs:11个控制访问的参数（除上面两个参数以外的其他11个字段）

# requests.put(url,data=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件，Request的内容
#    **kwargs:12个控制访问的参数（除上面一个参数以外的其他12个字段）

# requests.patch(url,data=None,**kwargs)
#    url:拟获取页面的url链接
#    data:字典、字节序列或文件，Request的内容
#    **kwargs:12个控制访问的参数（除上面一个参数以外的其他12个字段）

# requests.put(url,**kwargs)
#    url:拟删除页面的url链接
#    data:字典、字节序列或文件，Request的内容
#    **kwargs:13个控制访问的参数