HTTP协议传输大文件及断点续传的方式

Nice2cu_Code

已于 2022-06-26 19:08:16 修改

阅读量2.9k

点赞数

分类专栏：计算机网络文章标签： java http 网络

于 2021-08-11 12:17:33 首次发布

本文链接：https://blog.csdn.net/weixin_49343190/article/details/119602083

版权

计算机网络专栏收录该内容

13 篇文章 10 订阅

订阅专栏

HTTP传输大文件及断点续传的方式

文章目录

HTTP传输大文件及断点续传的方式

1. 数据压缩

通常浏览器在发送请求时都会带着 “Accept-Encoding” 头字段，里面是浏览器支持的压缩格式列表，例如 gzip、deflate、br 等，这样服务器就可以从中选择一种压缩算法，放进 “Content-Encoding” 响应头里用来标识这次传输使用的压缩算法，再把原数据压缩后发给浏览器。

优缺点：

数据压缩在处理文本的时候效果还是很好的，但是图片、音频视频等多媒体数据本身就已经是高度压缩的，再用压缩处理也不会变小，此种方式失效。

2. 分块传输

压缩是把大文件整体变小，但是如果大文件整体不能变小，那就把它“拆开”，分解成多个小块，把这些小块分批发给浏览器，浏览器收到后再组装复原。

这样浏览器和服务器都不用在内存里保存文件的全部，每次只收发一小部分，网络也不会被大文件长时间占用，内存、带宽等资源也就节省下来了。

在响应报文里用头字段 “Transfer-Encoding: chunked” 表示报文里的 body 部分不是一次性发过来的，而是分成了许多的块（chunk）分批发送。

注意：“Transfer-Encoding: chunked” 和 “Content-Length”这两个字段是互斥的，也就是说响应报文里这两个字段不能同时出现，一个响应报文的传输要么是长度已知，要么是长度未知（chunked）。

分块传输的编码规则：

每个分块含有两个部分，长度头和数据块
长度头是以 CRLF（回车换行，即\r\n）结尾的一行明文，用 16 进制数字表示某一块数据的长度
数据块紧跟在长度头后，最后也用 CRLF 结尾
最后用一个长度为 0 的块表示结束，如下图：

浏览器在收到分块传输的数据后会自动重新组装出内容。

3. 范围请求及断点续传

分块传输可以解决大文件传输的问题，但是有这么一种情况，看电影的过程中快进到某一段，也就是获取大文件中的某一段数据，分块传输并没有这个功能，这就需要使用范围请求。

客户端在请求头里使用 ”Range: bytes=左范围-右范围“ 来表示只获取文件的一部分，但是范围请求不是 Web 服务器必备的功能，可以实现也可以不实现，所以服务器必须在响应头里使用字段 “Accept-Ranges: bytes” 明确告知客户端：“支持范围请求”（客户端发送HEAD请求查询）。

如果服务器不支持范围请求，那么服务器可以发送 “Accept-Ranges: none”，或者干脆不发送 “Accept-Ranges” 字段，这样客户端就认为服务器没有实现范围请求功能，只能收发整块文件。

服务器收到 Range 字段后，需要做四件事：

检查范围是否合法，如果范围越界，服务器就会返回状态码416，意思是“你的范围请求有误，我无法处理，请再检查一下”。
如果范围正确，服务器就可以根据 Range 头计算偏移量，读取文件的片段了，返回状态码 “206 Partial Content” ，和 200 的意思差不多，但表示 body 只是原数据的一部分。
服务器要添加一个响应头字段 Content-Range: bytes 左范围 - 右范围 / 资源的总大小，表示将要返回指定范围内的实体内容。
服务器向客户端发送数据。

有了范围请求之后，HTTP 处理大文件就更加轻松了，看视频时可以根据时间点计算出文件的 Range，不用下载整个文件，直接精确获取片段所在的数据内容。

多段下载、断点续传的应用：