断点续传的原理

最新推荐文章于 2015-09-19 00:15:38 发布

showmethepower

最新推荐文章于 2015-09-19 00:15:38 发布

阅读量154

点赞数

文章标签：浏览器 IIS Excel Microsoft REST

转自：http://msplinks.com.cn/MDFodHRwOi8vZmFsY2hpb24uamF2YWV5ZS5jb20vYmxvZy8xNzAzNDY=

ftp断点续传的原理
客户端的实现步骤如下：

一、下载：
1、向服务器发送“REST + 本地文件长度”命令，告诉服务器，客户端要断点下载了。这时服务器还不知道客户端要下载哪个文件；
2、向服务器发送“RETR + 文件名”命令，通知服务器要下载的文件名，这时服务器开始定位文件指针读文件并发送数据。
3、客户端定位本地文件指针（文件末尾）；
4、两端的准备工作都做完了以后，客户端创建socket，以被动或非被动方式建立数据通道，循环调用recv接收数据并追加入本地文件；

二、上传：
1、获取服务器上和本地要上传文件的同名文件大小；
2、向服务器发送“APPE ＋文件名”，通知服务器，接下来从数据通道发送给你的数据要附加到这个文件末尾。
3、定位本地文件指针（和FTP上文件大小相同的位置）
4、从文件指针处读数据并发送。
代码里将断点上传和断点下载放到同一个函数（MoveFile）里，通过get参数说明是上传还是下载。当然，整个FTP类的实现有800多行，包括登录、退出、获取FTP文件大小、删除FTP服务器上文件、响应服务器，解析响应信息等函数。相应的注释代码里都有，这里就不一一熬述了。

HTTP断点续传的原理http://msplinks.com.cn/MDFodHRwOi8vd3d3Lml0LmNvbS5jbi9mL2VkdS8wNTgvMTcvMTU5NzU5Lmh0bQ==请求服务器上的一个文时，所发出的请求如下：
假设服务器域名为wwww.name.org，文件名为name.zip。
GET /name.zip HTTP/1.1
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-
excel, application/msword, application/vnd.ms-powerpoint, */*
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)
Connection: Keep-Alive
服务器收到请求后，按要求寻找请求的文件，提取文件的信息，然后返回给浏览器，返回信息如下：
200
Content-Length=106786028
Accept-Ranges=bytes
Date=Mon, 30 Apr 2001 12:56:11 GMT
ETag=W/"02ca57e173c11:95b"
Content-Type=application/octet-stream
Server=Microsoft-IIS/5.0
Last-Modified=Mon, 30 Apr 2001 12:56:11 GMT

所谓断点续传，也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给
Web服务器的时候要多加一条信息--从哪里开始。
下面是用自己编的一个"浏览器"来传递请求信息给Web服务器，要求从2000070字节开始。
GET /gman.zip HTTP/1.0
User-Agent: NetFox
RANGE: bytes=2000070-
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2

仔细看一下就会发现多了一行RANGE: bytes=2000070-
这一行的意思就是告诉服务器gman.zip这个文件从2000070字节开始传，前面的字节不用传了。
服务器收到这个请求以后，返回的信息如下：

206
Content-Length=106786028
Content-Range=bytes 2000070-106786027/106786028
Date=Mon, 30 Apr 2001 12:55:20 GMT
ETag=W/"02ca57e173c11:95b"
Content-Type=application/octet-stream
Server=Microsoft-IIS/5.0
Last-Modified=Mon, 30 Apr 2001 12:55:20 GMT

和前面服务器返回的信息比较一下，就会发现增加了一行：
Content-Range=bytes 2000070-106786027/106786028

返回的代码也改为206了，而不再是200了。

http断点续传内核的实现：

　　主要用了6个类，包括一个测试类。
　　SiteFileFetch.java负责整个文件的抓取，控制内部线程(FileSplitterFetch类)。
　　FileSplitterFetch.java负责部分文件的抓取。
　　FileAccess.java负责文件的存储。
　　SiteInfoBean.java要抓取的文件的信息，如文件保存的目录，名字，抓取文件的URL等。
　　Utility.java工具类，放一些简单的方法。
　　TestMethod.java测试类。

showmethepower

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
断点续传的原理

转自：http://msplinks.com.cn/MDFodHRwOi8vZmFsY2hpb24uamF2YWV5ZS5jb20vYmxvZy8xNzAzNDY= ftp断点续传的原理客户端的实现步骤如下：一、下载：1、向服务器发送“REST + 本地文件长度”命令，告诉服务器，客户端要断点下载了。这时服务器还不知道客户端要下载哪个文件；2、向服务器发送“RETR + 文件名”命令，通知服务...
复制链接

扫一扫