浏览器中的文件传输过程

最新推荐文章于 2024-06-24 21:56:35 发布

weixin_30872337

最新推荐文章于 2024-06-24 21:56:35 发布

阅读量1.3k

点赞数 2

文章标签：运维网络操作系统

原文链接：https://juejin.im/post/5d5b55c3e51d4561cf15dfcb

版权

在传输数据时，数据会经过应用层、传输层、网络层、数据链路层等包装数据（给数据加相应的头），最后通过物理层传输比特流到达目的地。

整个过程就像快递公司，装好货物 -> 填写收货人、寄货人地址 -> 选好寄送路线 -> 出发 -> 收货人拿到货物 -> 取货

既然要送出去，那就要知道送给谁；So IP 头中必然存放源 IP 地址与目标 IP 地址；除此之外，还存在一些版本、生存时间信息；

UDP 存放端口号，到达指定电脑后，根据端口号把数据包发给对应的程序； UDP 可以校验数据包是否正确，但对错误的只丢弃，不重发，所以速度快；适用领域：在线视频、互动游戏

建立连接（3 次握手） -> 传输数据 -> 断开连接（4 次挥手）

在 TCP/IP 五层结构中，http 协议属于应用层，应用层主要是来为操作系统和应用程序提供网络服务。而 TCP 属于传输层，传输层用来处理全部信息和提供可靠的数据传输服务。

keep-alive：保持 TCP 连接可以省去下次请求时需要建立连接的时间，提升资源加载速度；

观察了几个大厂发现除了百度，其余好像都没用 keep-alive, why?
电商网站图片比较多，如果使用 keep-alive 保持长连接，每个 TCP 连接最多只能发起 6 个请求，如果有 100 张以上的图片，那么请求是非常耗时的。

Keep-Alive 会增加服务器负载，这就是某些共享主机提供商禁用它的原因。每个开放连接都消耗内存以及文件描述符（linux），在极端情况下（某些 Apache 配置），它可能具有从连接到进程的 1：1 映射。 stackoverflow.com/questions/3…
欢迎补充...

为什么很多站点第二次打开速度很快？
因为有缓存：DNS 缓存，页面资源缓存（强缓存与协商缓存）
几种缓存字段
- expires: 绝对时间（格林尼治时间），因服务器与浏览器端时间很容易不一致，故不常用；
- max-age: 接上，于是就有了相对时间 max-age;
- Etag/If-None-Match 和 Last-Modified If-Modified-Since 都是协商缓存；
  区别在于 Last-Modified 是根据时间，etag 是根据内容的 hash 值来判断是否用缓存；
  Etag 适合于经常不变的资源；
  last-modified 适合于经常改变的资源，比如图片等；
登录状态如何保持？第一次登录时，reuqest 将数据传给服务端，reponse 中带上 set-cookie 头，浏览器读取后保存在本地，以后此域名发起请求时都带上；

如果一个页面的网络加载时间过久，如何分析卡在哪个阶段？
结合 network 面板分析，看哪部分请求耗时最长；
结合 performance 面板分析各个渲染阶段的耗时；
浏览器同时打开多个标签，如果端口一样，数据怎么知道去哪个标签？
端口一样的，网络进程中知道每个 tcp 链接对应的标签是哪个，所以接收到数据后，会分发给对应的渲染进程。
浏览器何时开始渲染页面？数据包的顺序是如何处理的？
浏览器接收到 http 响应头的 content-type 类型时，开始准备渲染进程；
响应体数据一旦到位便开始解析 DOM；
丢包与重传都是在 TCP 层解决的，http 保证数据是按照顺序接受的。(下层为上层提供服务。)
F5 与 ctrl + F5 区别？
F5 刷新走正常流程，该读缓存照样读缓存； ctrl + F5 忽略缓存，直接发起网络请求