FTP可用多种格式传输文件,通常由系统决定。大多数系统(包括UNIX系统)只有两种模式:文本模式和二进制模式。文本传输器使用ASCII字符,并由回车键和换行符分开,而二进制不用转换或格式化就可传字符,二进制模式比文本模式更快,并且可以传输所有ASCII值,所以系统管理员一般将FTP设置成二进制模式。
一般来说:如果你用错误的模式传输你的图片,你将无法看到图片,看到的会是乱码。如果你用错误模式上传CGI脚本,那么就将无法运行你的脚本,会看到类似Server 500 Error的出错信息。所以,必须使用正确的模式,图片和执行文件必须用BINARY模式,CGI脚本和普通HTML文件用ASCII模式上传。
ASCII和BINARY模式的区别:
用HTML和文本编写的文件必须用ASCII模式上传,用BINARY模式上传会破坏文件,导致文件执行出错。BINARY模式用来传送可执行文件,压缩文件,和图片文件。如果你用ASCII模式传,会显示一堆乱码,你必须重新用BINARY模式传。对于第二种情况,是因为有很多ftp服务器和客户端软件能自动识别文件类型,并采取相应的传输方式。
ftp是应用层协议,和具体的操作系统无关。ASCII模式和BINARY模式的区别是回车换行的处理,BINARY模式不对数据进行任何处理,ASCII模式将回车换行转换为本机的回车字符,比如Unix下是\n,Windows下是\r\n,Mac下是\r。
ASCII模式下会转换文件,不能说是不同系统对回车换行解释不同,而是不同系统有不同的行结束符,UNIX系统下行结束符是一个字节,即十六进制的0A,而MS的系统是两个字节,即十六进制的0D0A。所以当你用ASCII方式从UNIX的ftp server下载文件时(不管是二进制或者文本文件),每检测到一个字节是0A,就会自动插入一个0D,所以如果你的文件是二进制文件比如可执行文件、压缩包什么的,就肯定不能用了。如果你的文件就是UNIX下的文本文件,你用ASCII模式是正确的,要是误用了BINARY模式,你在Windows上看这个文件是没有换行的,里面是一个个的黑方块。
一般来说,我们最好都用BINARY方式,这样可以保证不出错。如果有文本格式转换的问题,即UNIX格式的文本和DOS格式的文本之间的转换,有很多工具可以做,不要在ftp传输的时候冒险,尤其是你如果对这些东西不是非常清楚的话。
可以使用MIME,把所有的字符,转换成0~128之间的字符,然后传送,在接收方再将接收到的字符MIME反向转换。通常我们发送邮件,就是使用这样的字符转换方式。
补充:文本模式和二进制模式传文本文件的具体区别可以通过在linux下使用cat -A 文件名 看到两者的区别,当然前提是在windows下上传的文本为DOS格式,这个可以用高级的文本编译器看,如ultraedit等。两者的区别是,二进制模式上传的文本比文本模式多一个^M符号,这个就是windows下DOS格式的/r回车符号,也就是上面提到的十六进制OD,在vi下使用全局替换:%s/^M//g [^M使用Ctrl+V+M而不是直接输入^M],去掉所有的回车符或者使用dos2unix file进行转换,这样保存后或者生成后的文件就和文本模式上传的文件一样了。