Asp.Net 上传大文件专题(3)--从请求流中获取数据并保存为文件[下]

 接着上一篇

      3.4 读取剩余的请求
      
前面我们已经提到过ReadEntityBody (Byte[] buffer, Int32 size)

方法,该方法可以用来读取客户端的请求数据。我们想要读取剩余部分的请求数据,就是要使用这个方法来从异名管道中循环取出请求。 [buffer:将数据读入的字节数组;size:最多读取的字节数;如果所被读取的剩余请求字节长度小于size,那么该方法会将多余的size大小的字节数组用0填充,这样会损失不必要的性能,因此我们在使用该方法前最好先判断下剩余的HTTP请求大小与size的关系。据其他前辈们测试该方法大多数读取的数据长度都在8192左右,所以size不必定的很大。]

 3.5 从请求中截取上传数据,并将除去文件数据后的请求写入缓存
      因为文件上传的特殊编码方式采用分隔符来分隔不同的内容,所以我们只要利用分隔符便能精确的获取文件数据所在的区间,然后将其中的数据截取。看起来是不是很简单呢?
      我们先来看一下文件上传的HTTP请求内容的实际存在形式(因为内容比较多,我选取其中一部分,其中的序号是为了方便说明加上去的):

 

 01 -----------------------------7d87d1cc0a88
 02 Content-Disposition: form-data; name="tbVideoName"
 03
 04 vnm
 05 -----------------------------7d87d1cc0a88
 06 Content-Disposition: form-data; name="file"; filename="C:/Documents and Settings/stg609/妗岄潰/浣冲彞.txt"
 07 Content-Type: text/plain
 08
 09 这里是我上传的文本内容
 10 -----------------------------7d87d1cc0a88
 11 Content-Disposition: form-data; name="__EVENTVALIDATION"
 12
 13 /wEWBgK0g/7JCQLrqYKOBgKj5pr/CAKBmOPQBQLY14yNBQKmmtpNX1cOVXyqN8xEER3ZXbnXzsUwVVo=
 14 -----------------------------7d87d1cc0a88--


      由上面的内容我们可以发现(1)分隔符为“-----------------------------7d87d1cc0a88”,其中的数字是随机的,并不固定,但是在同一个请求中都是相同的;(2)02、06、07、11等类似信息被称谓实体头,我们可以发现一个请求流中包含了所有控件(包括隐藏域);(3)实体内容与实体头之前用一个空行分开,也就是说有两个换行符,如02和04、07和09等;(4)最后一个内容的分隔符较一般的分隔符多出"--"。另外也可以发现,如果是文件上传,则实体头内会有"filename=文件路径"的信息。

      我们要做的便是将上述请求的09行的内容截取出来,而其它不变。但是要完整的截取文件数据并没有这么简单,而且还不止一个文件。因此我们要考虑很多因素,之前看过其它人的代码,感觉比较简短,但是似乎没有完全考虑到某些因素。
      我认为考虑因素应该包括如下几点[可能考虑的并不全面,或者考虑的太多,希望大家多提意见]
      a、因为我们以"filename="字符串为标识查找文件开始的位置,所以要判断该字符串是否为于两个数据流中
      b、"filename="之后开始到这之后的第一个换行符之前是文件名,所以为了正确获取文件名,要判断这之后的换行符是否与"filename="在同一个数据流内
      c、这之后是表示文件类型,在其后又有两个换行符,然后才是真正的文件数据首位置。为获取正确的开始位置,要判断两个换行符是否与"filename="在一个数据流内
      d、当开始读取数据,我们要知道什么时候文件结束,所以要查找分隔符,所以要确保分隔符在一个数据流内
      e、我们还要知道什么时候已经结束整个请求,所以要查找结束分隔符,因此要判断结束分隔符是否在一个数据流内
      至于如何确保标识符在一个数据流内,参考了一些前辈的做法。一般就是利用临时数组对可能分隔于两个数据流内的标识符进行保存。然后拼接在下一次数据流之前与下一次数据流一起做为整体进行处理。

      为了便于理解,我自己搞了个图,大家看看:


       通过上面这图,大家应该对整体的流程有了一定的认识,我们在编码中只需要按照上面的流程编码就基本上可以保证上传文件数据的完整性。
       我就不讲解全部代码了,到时候全系列写完之后,提供大家下载。要讲的主要有如下几点:
       1)如何获取分隔符
       通过reflector反编译System.Web.HttpRequest可以找到 GetMultipartBoundary()方法,这便是用来查找分隔符用的。代码如下:
2)如何知道文件数据开始
      由HTTP请求内容中可以看到,文件开始处数据与实体头之前差距两个换行符,所以我们首先找到“filename=”,然后找到“ Content-Type: ”,最后找到两个换行符的末尾,这便是文件开始处位置
 
      3)如何将数据写入文件
      首先根据文件名,我们可以在文件数据开始前创建一个文件。然后通过FileStream这个I/O流的Write方法将字节数组写入之前创建的文件。
[注意使用完FileStream必须将它关闭,否则所写入的文件一直处于被占用的情况,那其它程序将无法使用]

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值