Ftp多线程与断点续传

最新推荐文章于 2024-04-10 17:42:03 发布

michaelrun

最新推荐文章于 2024-04-10 17:42:03 发布

阅读量2.9k

点赞数

分类专栏：网络技术文章标签：多线程 ftp服务器服务器 rest socket mfc

网络技术专栏收录该内容

8 篇文章 0 订阅

订阅专栏

其实FTP断点续传的原理很简单，可分为断点下载和断点上传。

一、下载：
1、向服务器发送“REST + 本地文件长度”命令，告诉服务器，客户端要断点下载了。这时服务器还不知道客户端要下载哪个文件；
2、向服务器发送“RETR + 文件名”命令，通知服务器要下载的文件名，这时服务器开始定位文件指针读文件并发送数据。
3、客户端定位本地文件指针（文件末尾）；
4、两端的准备工作都做完了以后，客户端创建socket，以被动或非被动方式建立数据通道，循环调用recv接收数据并追加入本地文件；

二、上传：
1、获取服务器上和本地要上传文件的同名文件大小；
2、向服务器发送“APPE ＋文件名”，通知服务器，接下来从数据通道发送给你的数据要附加到这个文件末尾。
3、定位本地文件指针（和FTP上文件大小相同的位置）
4、从文件指针处读数据并发送。

这里重点说说PASV模式，即被动模式，这是FTP命令里比较不容易理解的一个，这条命令请求服务器在某个端口（非FTP默认端口或控制命令端口）创建一个监听socket，服务器创建的端口号会在客户端的控制命令通道上得到响应。得到这个端口号后，客户端就可以创建新的socket（数据通道）connect过去，并进行文件传输等工作。否则，如果为非被动模式，那么监听的socket由客户端创建，服务器connect过来。
对于这条命令的存在我是这么理解的，存在这么一种情况：客户端的IP是个内网的IP，服务器的IP是个外网的，当进行数据传输时内网的IP对于服务器是不可见的，只有由服务器启动监听socket才能建立数据通道，所以必须以被动模式进行。：）

===========以下转载==========

现在有不少软件可实现多线程下载.如NetAnts,JetCar等,其实多线程下载的原理并不复杂,主要的两项技术就是多线程和断点下载。程序中开启多个线程，每个线程利用断点下载，分别下载文件的不同部分，下载完后合并，就可以了。多线程编程很多书已有介绍，这里不再重复，关于断点下载，MFC中提供的CInternetFile类可实现HTTP的断点下载，但无法实现FTP的断点下载。因此，我们只好从FTP协议中的命令入手，自己编写个FTP类，来实现多线程下载。本人编写的CMultiFTP类（在WIN2000+IIS5。0下测试成功）已在CSDN发表。
FTP指令的详细信息，大家可从http://info.internet.isi.edu/in-notes/rfc/处获得，这里给大家介绍下与多线程下载有关的几个指令极其格式：
USER〈USERNAME〉：登陆FTP的用户名，执行成功返回220；
PASS〈PASSWORD〉：密码，执行成功返回230；
REST〈POS〉：指定文件下载的开始位置，执行成功返回350；
SIZE〈FILENAME〉：文件大小，执行成功返回213；
PASV：建立数据连接，同时取得FTP服务器下载文件时用的端口号，执行成功返回227；
TYPE：指定下载文件的类型，参数为I是二进制文件，为A是字符文件，执行成功返回200；
RETR〈FILENAME〉：下载文件，执行成功返回125；

这些命令中，REST，RETR，SIZE三个命令最关键，在后面会给大家更详细的说明，另外执行FTP命令，FTP服务器会向客户端返回一代码，命令执行成功的代码上面已给出。向服务器发送命令，可把命令当作字符串向服务器发送，如：send(socket,”rest 100/r/n”,…)(注意：要在命令后加/r/n)。
在介绍多线程下载前，先给大家介绍下连接FTP服务器和从FTP服务器下载文件的过程。连接FTP SERVER很简单，创建一套接字，指定服务器的地址和端口号，连接到服务器，再向它发送USER和PASS命令，服务器返回230，就代表登陆成功，并且服务器和客户建立了一控制连接。
FTP服务器下载文件的过程比较复杂。首先，客户端要和服务器建立一数据连接，可用PORT或PASV命令建立数据连接，PORT命令要自己指定一端口号用于下载，PASV命令则由服务器分配一端口号，客户端可从服务器的返回信息提取端口号，返回信息的格式为：
（服务器IP，端口号），本人的程序将使用PASV命令。然后向服务器发送RETR命令下载文件，或先发送一REST命令指明从哪下载文件。之后，要建立一新的套接字，连接到数据连接指定的端口，文件数据就从这个套接字下载。下载完毕后，关闭套接字。
现在进入本篇的精华，实现多线程下载。执行完登陆操作后，先发送“REST 100”命令，测试下服务器是否支持断点下载，如返回成功代码，就可实现多线程下载；然后发送“SIZE”，取得文件的大小，根据文件大小，将文件分为几部分，记下各部分的偏移地址，并作为参数，交给各线程去下载。在下载线程中，先接受主线程传给他的参数（文件名，偏移地址，保存地址等），再发送“PASV”命令，建立数据连接，并新建一套接字连接到新的端口；然后根据文件类型，二进制文件发送“TYPE I“命令，文本文件发送”TYPE A“命令；之后发送“REST 〈文件偏移地址〉”命令，通知服务器改变将要下载的文件的开始地址；最后，执行“RETR 〈文件名〉”命令，下载文件。下载完毕后，编段代码合并文件即可。
在这里有个问题，就是主线程如何得知各下载线程已执行完毕。WINDOWS提供了几种线程互斥技术，如CriticalSection,Mutex等，关于他们的详细信息，大家可参考各种编程书籍，在这里我推荐使用CriticalSection技术。可以在程序中建立一全局计数器，在文件下载前置零，并建立一全局CriticalSection变量。在下载线程中，当文件下载完毕后，先锁定全局CriticalSection变量，之后将计数器加一，再释放全局CriticalSection变量。主线程中，可建立一定时，定期检查计数器的值，或让下载线程在下载完毕后调用主线程的某个函数。这样，主线程就可随时发现文件已下载完毕，可合并文件了。
多线程下载的程序设计就是这样，一点都不难。看来掌握某些计算机技术，特别是网络技术，最好还是从实现原理入手，掌握其最精华的部分，激发自己的灵感，编写出个优秀软件。老停留在使用别人的组件和函数库的基础上，你的水平不会有太大提高。