Multipart/form-data POST文件上传详解

理论
简单的HTTP POST
大家通过HTTP向服务器发送POST请求提交数据,都是通过form表单提交的,代码如下:

提交时会向服务器端发出这样的数据(已经去除部分不相关的头信息),数据如下:

对于普通的HTML Form POST请求,它会在头信息里使用Content-Length注明内容长度。头信息每行一条,空行之后便是Body,即“内容”(entity)。它的Content-Type是application/x-www-form-urlencoded,这意味着消息内容会经过URL编码,就像在GET请 求时URL里的QueryString那样。txt1=hello&txt2=world
POST上传文件
最早的HTTP POST是不支持文件上传的,给编程开发带来很多问题。但是在1995年,ietf出台了rfc1867,也就是《RFC 1867 -Form-based File Upload in HTML》,用以支持文件上传。所以Content-Type的类型扩充了multipart/form-data用以支持向服务器发送二进制数据。因此发送post请求时候,表单

属性enctype共有二个值可选,这个属性管理的是表单的MIME编码:
①application/x-www-form-urlencoded(默认值)
②multipart/form-data
其实form表单在你不写enctype属性时,也默认为其添加了enctype属性值,默认值是enctype=”application/x- www-form-urlencoded”.

通过form表单提交文件操作如下:

浏览器将会发送以下数据:

我们来分析下数据,第一个空行之前自然还是HTTP header,之后则是Entity,而此时的Entity也比之前要复杂一些。根据RFC 1867定义,我们需要选择一段数据作为“分割边界”( boundary属性),这个“边界数据”不能在内容其他地方出现,一般来说使用一段从概率上说“几乎不可能”的数据即可。 不同浏览器的实现不同,例如火狐某次post的 boundary=—————————32404670520626 , opera为boundary=———-E4SgDZXhJMgNE8jpwNdOAX ,每次post浏览器都会生成一个随机的30-40位长度的随机字符串,浏览器一般不会遍历这次post的所有数据找到一个不可能出现在数据中的字符串,这样代价太大了。一般都是随机生成,如果你遇见boundary值和post的内容一样,那样的话这次上传肯定失败,不过我建议你去买彩票,你太幸运了。Rfc1867这样说明{A boundary is selected that does not occur in any of the data. (This selection is sometimes done probabilisticly.)}。

选择了这个边界之后,浏览器便把它放在Content-Type 里面传递给服务器,服务器根据此边界解析数据。下面的数据便根据boundary划分段,每一段便是一项数据。(每个field被分成小部分,而且包含一个value是”form-data”的”Content-Disposition”的头部;一个”name”属性对应field的ID,等等,文件的话包括一个filename)
IE和Chrome在filename的选择策略上有所不同,前者是文件的完整路径,而后者则仅仅是文件名。
数据内容以两条横线结尾,并同样以一个换行结束。在网络协议中一般都以连续的CR、LF(即\r、\n,或0x0D、Ox0A)字符作为换行,这与Windows的标准一致。如果您使用其他操作系统,则需要考虑它们的换行符。
另外Content-length 指的是所用数据的长度。
实现
httpClient4如何实现
httpClient4使用http-mime.jar包的MultipartEntity实现,代码如下(为了简洁,处理了异常处理代码):

参考:
Rfc1867:http://www.ietf.org/rfc/rfc1867
Rfc1867:http://www.vivtek.com/rfc1867.html

http://blog.csdn.net/xiaojianpitt/article/details/6856536

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
multipart/form-data是一种用于在HTTP POST请求中传递数据的编码格式。它是通过设置请求头的Content-Type为multipart/form-data来指定的。 该格式使用一个boundary字符串来分隔请求头和请求体的数据,每个数据段都以"--${boundary}"开头和结尾,中间是具体的数据内容。 具体使用multipart/form-data格式的POST请求的步骤如下: 1. 在请求头中设置Content-Type为multipart/form-data,并设置boundary的值。 2. 构建请求体的数据段,每个数据段都以"--${boundary}"开始和结束。 3. 每个数据段包括一个头部和一个数据部分。头部包括Content-Disposition和Content-Type等字段,用于描述数据的类型和属性。数据部分即实际要传输的数据。 4. 所有数据段按顺序组成请求体,每个数据段之间以"--${boundary}"分隔。 5. 最后以"--${boundary}--"表示请求体的结束。 通过以上步骤,就可以将数据以multipart/form-data格式进行编码,并通过POST请求发送到服务器。这种格式常用于上传文件或提交表单数据等场景,能够有效地传递复杂的数据结构。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Multipart/form-data POST文件上传详解](https://blog.csdn.net/iteye_13868/article/details/82165506)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [multipart/form-data (一种POST 数据提交的方式)](https://blog.csdn.net/dreamerrrrrr/article/details/111146763)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值