学习python的网络数据获取（爬虫）

最新推荐文章于 2024-07-18 10:00:00 发布

倾城———

最新推荐文章于 2024-07-18 10:00:00 发布

阅读量471

点赞数

分类专栏：编程个人文章标签： python

本文链接：https://blog.csdn.net/qq_31856845/article/details/110129285

版权

本文介绍了Python中的requests模块，用于网络数据获取，包括GET、POST等请求方式。同时，讲解了常见正则表达式解析方法，如字符集、数量修饰和边界匹配，帮助理解数据抓取过程。

摘要由CSDN通过智能技术生成

学习python的网络数据获取（爬虫）

前言

Requests的安装：
Requests库是目前公认的爬取网页最好的Python第三方库，具有简单、简捷的特点。
官方网站：http://www.python-requests.org
在"C:\Windows\System32"中找到"cmd.exe"，使用管理员身份运行，在命令行中输入：“pip install requests”运行。

requests.request() 构造一个请求，支撑以下各方法的基础方法
requests.get() 获取HTML网页的主要方法，对应于HTTP的GET
requests.head() 获取HTML网页头信息的方法，对应于HTTP的HEAD
requests.post() 向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put() 向HTML网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch() 向HTML网页提交局部修改请求，对应于HTTP的PATCH
requests.delete() 向HTML页面提交删除请求，对应于HTTP的DELET