Web上传文件的原理及实现[转]

最新推荐文章于 2023-05-22 20:22:00 发布

tianhandigeng

最新推荐文章于 2023-05-22 20:22:00 发布

阅读量78

点赞数

分类专栏： java 文章标签： Web ASP.net ASP IE Firefox

本文链接：https://blog.csdn.net/tianhandigeng/article/details/83881335

版权

java 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

现在有很多 Web程序都有上传功能，实现上传功能的组件或框架也很多，如基于 java的 Commons FileUpload 、还有 Struts1.x和 Struts2中带的上传文件功能（实际上， Struts2在底层也使用了 Commons FileUpload）。在 asp.net中也有相应的上传文件的控件。

虽然现在有很多上传组件可以利用，但是了解 Web上传文件的原理，对于处理突然出现的问题会有很大的帮助，下面就来讲一下通过浏览器上传文件的基本原理。在了解了原理之后，就可以非常容易地自制满足自身需要的上传组件了。

众所周知，在客户端代码中需要使用 <input type='file' name='file' /> 来选择要上传的文件，并上传，代码如上：

< html >
     < head >
         < title > upload </ title >
         < meta http-equiv ="description" content ="this is my page" >
         < meta http-equiv ="content-type" content ="text/html; charset=GB18030" >
     </ head >

     < body >
         < form action ="servlet/UploadFile" method ="post"
            enctype ="multipart/form-data" >
             < input type ="file" name ="file1" id ="file1" />
             < input type ="file" name ="file2" id ="file2" />
             < input type ="submit" value ="上传" />
         </ form >
     </ body >
</ html >

从上面的代码可以看出，有两个文件选择框（ file1和 file2），在上传文件时， <form>标签必须加上 enctype="multipart/form-data"，否则浏览器无法将文件内容上传到服务端。下面我们来做个实验。在 Servlet的 doPost方法中编写如下的代码，如果想使用 asp.net或其他的语言或技术，也可以很容易实现相应的功能。

    public void doPost(HttpServletRequest request, HttpServletResponse response)
             throws ServletException, IOException
    {
        java.io.InputStream is = request.getInputStream();
        java.io.FileOutputStream fos = new java.io.FileOutputStream( " d:\\out.txt " );

         byte [] buffer = new byte [ 8192 ];
         int count = 0 ;
         while ((count = is.read(buffer)) > 0 )
        {
            fos.write(buffer, 0 , count);
        }
        fos.close();
    }

    上面的功能非常简单，只是通过 request 获得一个 InputStream 对象，并通过这个对象从客户端获得发送过来的字节流（注意，一定要用字节流，因为，上传的文件可能是二进制文件，如图象文件，因此，使用字节流会更通用）。并将这些字节流保存在 D 盘的 out.txt 文件中。然后我们打开 out.txt ，文件的内容如图 1 所示：


                                                                                   图1

由于 out.txt是使用文本形式打开的，并且 file1上传的是 a.jpg(一个图象文件 )，因此，显示的是一些乱码。我们可以不用管它们。只需要看看这些内容的头部。我们很快就可以找到规律。每一个文件内容的头部都由“ -----------------------------30514443229777”分隔，然后是这个文件的属性，如下：

Content-Disposition: form-data; name="file1"; filename="a.jpg"

Content-Type: image/jpeg

其中包含了文件选择框的 name属性，还有上传的文件名（ filename字段），要注意的， firefox在上传时，这个 filename属性值只是文件名，如果使用 IE，就是带路径的文件名，如 D:"a.jpg。

接下来的规则就和 HTTP的头一样了，以一个空行（ "r"n）分隔。后面就是文件的具体内容。现在最关键的文件的结尾，从图 1可以看出，文件的结尾也是“ -----------------------------30514443229777”，因此，可以断定，第一个上传的文件（包括文件头）是夹在两个“ -----------------------------30514443229777”之间的。而“ -----------------------------30514443229777”就是 multipart/form-data协议的分隔符。但这里还有一个最关键的问题。这个分隔符每次上传都不一样，服务端是如何知道每次上传的这个分隔符的呢？

实际上，这个分隔符是通过 HTTP请求头的 Content-Type字段获得，可通过下面的代码输出这个字段值：

System.out.println(request.getHeader("Content-type"));

输出的内容如下：

multipart/form-data; boundary=---------------------------106712230227687

只要在服务端获得 boundary后面的值即可。经过测试， Content-Type中的分隔符号中的“ -”比实际上传的“ -”少两个，不知是怎么回事。不过这没关系，我们可以认为每一个文件块是以 ""r"n—“结尾的，或是直接将从 boundary获得的分隔符加两个“ —”。而最后结尾的分隔符是“ ---------------------------106712230227687—”，后面多了两个“ —”。

综合上述，也就是说，一个文件块是以“ ---------------------------106712230227687”开头，以“ —”结尾，从图 2可以看出这一切。

图 2

至于剩下的工作，就是按着上面的规则来分析这些字符流了。分析的方法很多。在这里就不详述了。

tianhandigeng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Web上传文件的原理及实现[转]

现在有很多Web程序都有上传功能，实现上传功能的组件或框架也很多，如基于java的Commons FileUpload、还有Struts1.x和Struts2中带的上传文件功能（实际上，Struts2在底层也使用了Commons FileUpload）。在asp.net中也有相应的上传文件的控件。虽然现在有很多上传组件可以利用，但是了解Web上...
复制链接

扫一扫