Python网络爬虫入门版笔记一、HTTP协议

最新推荐文章于 2024-09-22 17:12:26 发布

RecycleBins

最新推荐文章于 2024-09-22 17:12:26 发布

阅读量162

点赞数 1

分类专栏： Python网络爬虫——入门篇文章标签： python 网络 http 编程语言

本文链接：https://blog.csdn.net/tomatoarmys/article/details/105226237

版权

Python网络爬虫——入门篇专栏收录该内容

11 篇文章 0 订阅

订阅专栏

在笔记开始之前首先说明：此笔记是我看北京理工大学嵩天老师慕课网络爬虫课程时做的笔记，具体链接如下：北京理工大学网络爬虫与信息提取课程
嵩天老师讲解的也十分清楚，每节课程也十分精炼紧凑，很适合只掌握Python基础的小伙伴们入门网络爬虫，非常推荐各位一起参与学习。
前面刚开始的笔记比较简陋，后面记得比较详细清晰，希望各位谅解。此外，笔记中存在一些课程内容的截图，如有侵权，请联系我，我一定及时更正。如果笔记存在什么问题或者有可以改进的地方，也请各位评论区指正探讨，十分感谢。现在。就让我们一起开始学习爬虫吧。
哦对，学习爬虫最好要有一定的HTML基础能力（学习起来很快的），不然理解起来会很费劲。

HTTP协议

一、什么是HTTP

HTTP：Hypertext Transfer Protocol，超文本传输协议
http协议是基于“请求与响应“模式的、无状态的应用层协议。采用URL作为定位网络资源的标识。
无状态指的是本次请求与下一次请求并没有关联。应用层指的是，该协议工作在TCP协议之上。
URL可以理解为文件资源的Internet路径。

二、HTTP的作用

http拥有对资源进行操控的方法，主要有以下：

方法	说明
GET	请求URL位置的资源
HEAD	请求URL位置资源的响应消息报告，即获得该资源的头部信息
POST	请求向URL位置的资源后附加新的数据
PUT	请求向URL位置存储一个资源，覆盖原URL位置的资源
PATCH	请求局部更新URL位置的资源，即即改变该处资源的部分内容
DELETE	请求删除URL位置存储的资源