一、文件头
From:
生成>
Subject: =?gb2312?B?[TITLE]?=
Date: [DATE]
MIME-Version: 1.0
Content-Type: multipart/related;
type="text/html";
boundary="----=_NextPart_000_0002_01C6DA8C.AF3B6620"
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2962
This is a multi-part message in MIME format.
二、分界符
------=_NextPart_000_0002_01C6DA8C.AF3B6620
三、各部分网页内容的描述
A、 文本内容(通常采用base64编码或quoted-printable报文编码)
Content-Type: text/html;
charset="utf-8"(字符集)
Content-Transfer-Encoding: quoted-printable(内容编码方式)
Content-Location: ICode MHTML Generator
A、 图片(通常采用base64编码)
Content-Type: image/png (图片的格式)
Content-Transfer-Encoding: base64 (图片的编码格式)
B、 引用外部的JS 或 CSS 文件(通常采用quoted-printable报文编码)
Content-Type: text/javascript
Content-Transfer-Encoding: quoted-printable
-----------------------------------------------------------------------------
Content-Type: text/css
Content-Transfer-Encoding: quoted-printable
【注】每部分内容之间必须使用(二部分)的分界符
四、最后一行中也必须加上分界符
五、中文乱码问题的解决
需要被转换的HTML页面采用的是什么字符集,那么在对HTML页面内容的读取和文本内容的编码处理中就必须用相应的字符集进行处理。目前我们的MHTML转换程序中全部采用的是UTF-8编码处理,所以转换含有中文的采用UTF-8字符集的HTML页面,完全没有问题。