不懂Web基本原理怎么能学好爬虫。（二、Web服务器工作原理）（爬虫、反爬虫、服务器、客户端、网络协议）

骑摩托的蜗牛

已于 2022-05-25 16:27:54 修改

阅读量209

点赞数

分类专栏：不懂Web原理怎么学好爬虫文章标签：爬虫前端 python 服务器 http

于 2022-05-16 20:30:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58859743/article/details/124807242

版权

前言

爬虫的主要目的是获取Web网站中的内容。想要爬虫获取数据，就需要了解HTML从文档变成内容丰富的页面所要经历的每个阶段。例如网络请求、资源匹配、数据传输和页面渲染。要想学好爬虫，我们需要先了解web网站的构成和页面渲染过程的相关知识。

二、Web服务器工作原理

Web服务器概念较为广泛，我们最常说的Web服务器指的是网站服务器，它是建立在Internet之上并且驻留在某种计算机上的程序。Web服务器可以向Web客户端(如浏览器)提供文档或其他服务，只要是遵循HTTP协议而设计的网络应用程序都可以是Web客户端。

Web服务器和HTTP服务器可以说是同一个东西，当然非得细分的话，HTTP服务器是建立在HTTP协议之上的提供文档浏览的服务器，更多的是提供静态的文件。而Web服务器涵盖了HTTP服务器(这一点可以自行百度百科), Web服务器不仅能够存储信息，还能在用户通过Web浏览器提供的信息的基础上运行脚本和程序。

Web服务器约等于 HTTP服务器 + 其他服务

目前所熟知的Web服务器有很多，其最主流的是 Apache, Nginx, IIS

各大Web服务器的实现细节都不同，是为了某种情形而设计开发的。但是它们的基础工作原理是相同的，这也是本次基础篇所讲解的内容。

1、Web服务器工作原理图解

首先我们暂时不考虑HTTP协议的各种请求方式，将一次Web服务的工作流程过一遍，我们假设以浏览器作为客户端

最低0.47元/天解锁文章

骑摩托的蜗牛

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
不懂Web基本原理怎么能学好爬虫。（二、Web服务器工作原理）（爬虫、反爬虫、服务器、客户端、网络协议）

Web服务器概念较为广泛，我们最常说的Web服务器指的是网站服务器，它是建立在Internet之上并且驻留在某种计算机上的程序。Web服务器可以向Web客户端(如浏览器)提供文档或其他服务，只要是遵循HTTP协议而设计的网络应用程序都可以是Web客户端。不懂Web基本原理怎么能学好爬虫。（二、Web服务器工作原理）（爬虫、反爬虫、服务器、客户端、网络协议）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。