word文件转换为html格式,word转html格式的方法

WordToHtml.aspx.cs

using System;

using System.Collections;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Web;

using System.Web.SessionState;

using System.Web.UI;

using System.Web.UI.WebControls;

using System.Web.UI.HtmlControls;WordToHtml.aspx.cs

using System;

using System.Collections;

using System.ComponentModel;

using System.Data;

using System.Drawing;

using System.Web;

using System.Web.SessionState;

using System.Web.UI;

using System.Web.UI.WebControls;

using System.Web.UI.HtmlControls;

using Office;

namespace aspxWebcs

{

///

/// WordToHtml 的摘要说明。

/// 首先要添加引用:Microsoft Word 9.0 Object Library

///

public class WordToHtml : System.Web.UI.Page

{

private void Page_Load(object sender, System.EventArgs e)

{

// 在此处放置用户代码以初始化页面

Word.ApplicationClass word = new Word.ApplicationClass();

Type wordType = word.GetType();

Word.documents docs = word.documents;

// 打开文件

Type docsType = docs.GetType();

object fileName = "d:\\tmp\\aaa.doc";

Word.document doc = (Word.document)docsType.InvokeMember("Open",

System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});

// 转换格式,另存为

Type docType = doc.GetType();

object saveFileName = "d:\\tmp\\aaa.html";

//下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成:

/*

docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,

null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML});

*/

///其它格式:

///wdFormatHTML

///wdFormatdocument

///wdFormatDOSText

///wdFormatDOSTextLineBreaks

///wdFormatEncodedText

///wdFormatRTF

///wdFormatTemplate

///wdFormatText

///wdFormatTextLineBreaks

///wdFormatUnicodeText

docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,

null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});

// 退出 Word

wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod,

null, word, null);

}

#region Web 窗体设计器生成的代码

override protected void OnInit(EventArgs e)

{

//

// CODEGEN: 该调用是 ASP.NET Web 窗体设计器所必需的。

//

InitializeComponent();

base.OnInit(e);

}

///

/// 设计器支持所需的方法 - 不要使用代码编辑器修改

/// 此方法的内容。

///

private void InitializeComponent()

{

this.Load += new System.EventHandler(this.Page_Load);

}

#endregion

}

}

using Office;

namespace aspxWebcs

{

///

/// WordToHtml 的摘要说明。

/// 首先要添加引用:Microsoft Word 9.0 Object Library

///

public class WordToHtml : System.Web.UI.Page

{

private void Page_Load(object sender, System.EventArgs e)

{

// 在此处放置用户代码以初始化页面

Word.ApplicationClass word = new Word.ApplicationClass();

Type wordType = word.GetType();

Word.documents docs = word.documents;

// 打开文件

Type docsType = docs.GetType();

object fileName = "d:\\tmp\\aaa.doc";

Word.document doc = (Word.document)docsType.InvokeMember("Open",

System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] {fileName, true, true});

// 转换格式,另存为

Type docType = doc.GetType();

object saveFileName = "d:\\tmp\\aaa.html";

//下面是Microsoft Word 9 Object Library的写法,如果是10,可能写成:

/*

docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,

null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML});

*/

///其它格式:

///wdFormatHTML

///wdFormatdocument

///wdFormatDOSText

///wdFormatDOSTextLineBreaks

///wdFormatEncodedText

///wdFormatRTF

///wdFormatTemplate

///wdFormatText

///wdFormatTextLineBreaks

///wdFormatUnicodeText

docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,

null, doc, new object[]{saveFileName, Word.WdSaveFormat.wdFormatHTML});

// 退出 Word

wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod,

null, word, null);

}

#region Web 窗体设计器生成的代码

override protected void OnInit(EventArgs e)

{

//

// CODEGEN: 该调用是 ASP.NET Web 窗体设计器所必需的。

//

InitializeComponent();

base.OnInit(e);

}

///

/// 设计器支持所需的方法 - 不要使用代码编辑器修改

/// 此方法的内容。

///

private void InitializeComponent()

{

this.Load += new System.EventHandler(this.Page_Load);

}

#endregion

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HTML 转换Word 并保留格式可以使用 Apache POI 的 XWPF API。以下是一个示例代码: ```java import java.io.*; import org.apache.poi.xwpf.usermodel.*; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class HtmlToWord { public static void main(String[] args) { String html = "<html><body><p>Hello, World!</p></body></html>"; String output = "output.docx"; try { // 将 HTML 转换Word 文档 XWPFDocument docFile = new XWPFDocument(); Document doc = Jsoup.parse(html); Elements elements = doc.body().children(); for (Element element : elements) { XWPFParagraph paragraph = docFile.createParagraph(); XWPFRun run = paragraph.createRun(); run.setText(element.text()); run.addBreak(); } // 保存 Word 文档 FileOutputStream fos = new FileOutputStream(output); docFile.write(fos); fos.close(); System.out.println("HTML 转换Word 完成"); } catch (Exception e) { e.printStackTrace(); } } } ``` 在这个示例中,我们将一个 HTML 字符串转换为一个 `Document` 对象,然后使用 `Jsoup` 库从 `body` 元素中提取所有子元素。接着创建一个 `XWPFDocument` 对象,并为每个子元素创建一个段落,然后将段落中的文本赋值为子元素的文本,并添加一个换行符。最后将文档保存为 Word 文件。 请注意,使用这种方式将 HTML 转换Word,由于 HTMLWord 的排版方式不同,因此可能会存在一些格式上的损失。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值