http协议

最新推荐文章于 2024-02-19 22:56:04 发布

包_子

最新推荐文章于 2024-02-19 22:56:04 发布

阅读量896

点赞数

本文链接：https://blog.csdn.net/zuiku_baozi/article/details/40351325

版权

学习笔记专栏收录该内容

17 篇文章 0 订阅

订阅专栏

学习了好一段时间的web开发了，从一开始接触近几年流行起来的angular.js，到node.js。几乎都把注意力放在了代码如何写才能达到怎么样的效果，特别是在node.js中感觉花了大多数时间去理解程序代码的结构，如何实现相应的功能，当用到session的时候无法保存想要缓存的变量，就很迷茫。。打印出整个session的内容也是让人瞬间就醉了。。实际上就是因为对web应用所依赖的这一套网络传输协议的不够熟悉，很多东西都是一知半解的，这样的状况显然会让开发变得很痛苦。。。

于是在一些压力下，我也好好研究了一下页面的背后到底发生了些什么。下面写下我在参考了一些大神的博文之后的个人的理解。

1、url的完整结构

schema://host/path/.../query_string/#anchor

如上所示，schema是表示用的什么协议，如http ，https等

host是要请求的主机名或者ip地址，如www.baidu.com或115.239.211.92

path是主机上的资源路径，就是某特定页面

query_string就是发送给服务器的数据，用于对页面的渲染等，比如请求商品详情页面对应哪一个商品的详情就由这里的数据确定

anchor表示锚，用于快速定位某页面的某锚元素，细节请参考google。。

2、在请求一个页面之后，浏览器如何将一个加载好的页面呈现给我们的

首先我们在url栏输入对应的url地址，格式如上。·按下回车之后，浏览器首先会查看本地缓存有没有对应资源的信息，并且向缓存中的该资源的主机发送一个请求确认是否有过改动，主机返回304表示没有改动，直接加载，否则重新从服务器请求页面。然后检查hosts文件，如果找到对应的主机地址就向该主机发送http request请求，如果hosts里边也没有的话就使用域名解析系统，向DNS服务器发送请求找到该主机的ip地址。然后浏览器就可以向服务器发送请求了，一般会受到请求的是代理服务器，在代理服务器上如果有缓存的对应资源就直接将该html页面回发给客户端，如果没有就通过一些负载均衡的算法来在服务器集群上寻找合适的服务器来处理该请求，这里负载均衡的一些算法以及服务器如何共享资源信息的问题就暂不讨论。这样从服务器就会通过给客户端发送一个http response信息回应客户端的请求，这个response信息里边就是这个请求对应的html页面。客户浏览器接收到这个response信息的时候，会对这个文件进行渲染，当发现页面当中有包括图片，css，javascript等资源文件时，就会再次向服务器发送http请求以获取页面需要的资源文件，一次请求请求一个文件，在http1.0中http协议的connection属性没有keep-alive，因此每次都会再次建立连接，在http1.1中连接默认都有一个属性是keep-alive的，因此在再次请求资源的时候不需要再次建立连接（当然这里再次请求资源文件的时候，每一个请求是没有先后顺序的可以同时发起，但是会有限制在6个左右，根据chrome团队的实验，连接数达到10效率就会有很大的下降）。好了，当所有资源加载完了，一个完整的页面也就呈现在我们的浏览器中了。

3、http request结构