本文将介绍两种将HTML转换为Word的方式:
- 将HTML文件转换为Word
- 将HTML String插入到Word
本方案所使用的是Spire.Doc组件,在使用以下代码前,需要下载Spire.Doc并安装,然后从安装路径bin文件夹下引用Spire.Doc.dll到你的工程中,也可以通过NuGet Package Manager搜索Spire.Doc并安装。
HTML转Word
HTML转Word很简单,通过Document对象加载HTML文件,然后使用 SaveToFile方法即可将HTML转换为Word格式。
//创建Document实例
Document document = new Document();
//加载HTML文档
document.LoadFromFile("Sample.html", FileFormat.Html, XHTMLValidationType.None);
//保存为Word
document.SaveToFile("HTMLtoWord.docx", FileFormat.Docx);
document.Close();
HTML String插入到Word
下面的代码可以将HTML String添加到一个段落的末尾,也可以插入到段落中的一个指定位置。
//创建Document实例
Document document = new Document();
//加载Word文档
document.LoadFromFile("Input.docx");
//HTML string
string htmlstring =
@"<html>
<head/>
<body>
<h1>Html Heading</h1>
<p>This is an html document in a string literal.</p>
</body>
</html>";
//添加HTML String到Word中第一个段落的末尾
document.Sections[0].Body.Paragraphs[0].AppendHTML(htmlstring);
//添加HTML String到第三个段落的段首
document.Sections[0].Body.InsertXHTML(htmlstring, 2, 0);
/保存并关闭
document.SaveToFile("Output.docx");
document.Close();