- HTTP 协议始于三十年前蒂姆·伯纳斯 - 李的一篇论文;
- HTTP/0.9 是个简单的文本协议,只能获取文本资源;
- HTTP/1.0 确立了大部分现在使用的技术,但它不是正式标准;
- HTTP/1.1 是目前互联网上使用最广泛的协议,功能也非常完善;
- HTTP/2 基于 Google 的 SPDY 协议,注重性能改善,但还未普及;
- HTTP/3 基于 Google 的 QUIC 协议,是将来的发展方向。
理解:
协议标准不同于原理,原理是相对稳定的,而标准则需要与时俱进,随着业务和技术发展中出现的新问题一起变化。在实际商业应用、竞争和实践中反复打磨,让协议标准适应不断发展变化的实际业务问题,而不是让日渐庞大复杂的业务去适应受限于特定时空因素的标准。标准的诞生和发展一方面是基于具体业务需要和技术发展,另一方面是为了统一游戏规则,让各厂商的软硬件产品可以方便地“互联”,降低“沟通”和“翻译”的成本,提高网络互联的开放性
- HTTP 是一个用在计算机世界里的协议,它确立了一种计算机之间交流通信的规范,以及相关的各种控制和错误处理方式。
- HTTP 专门用来在两点之间传输数据,不能用于广播、寻址或路由。
- HTTP 传输的是文字、图片、音频、视频等超文本数据。
- HTTP 是构建互联网的重要基础技术,它没有实体,依赖许多其他的技术来实现,但同时许多技术也都依赖于它。
理解:
在互联网世界里,HTTP 通常跑在 TCP/IP 协议栈之上,依靠 IP 协议实现寻址和路由、TCP 协议实现可靠数据传输、DNS 协议实现域名查找、SSL/TLS 协议实现安全通信。此外,还有一些协议依赖于 HTTP,例如 WebSocket、HTTPDNS 等。这些协议相互交织,构成了一个协议网,而 HTTP 则处于中心地位。
- 互联网上绝大部分资源都使用 HTTP 协议传输;
- 浏览器是 HTTP 协议里的请求方,即 User Agent;
- 服务器是 HTTP 协议里的应答方,常用的有 Apache 和 Nginx;
- CDN 位于浏览器和服务器之间,主要起到缓存加速的作用;
- 爬虫是另一类 User Agent,是自动访问网络资源的程序。
理解:
- CDN本身不能区分浏览器还是爬虫。因为爬虫可以把UA设置成浏览器,如果网站归属者没有验证码或者其他验证方式区分的话浏览器和爬虫都被视为User Agent(客户代理);对待爬虫可以特殊处理返回特定内容。
- Web Service 是网络服务实体是一种api接口,用来调用获取信息; 而 Web Server 是网络服务器用来出来http等网络请求,后者的存在是为了承载前者。WebService是基于Web(HTTP)的服务器架构技术,基于HTTP协议传输xml或soap数据。WebServer分硬件和软件,硬件指服务器、云之类,软件如Nginx、Apache等。