word转成html

using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Collections;
using System.Configuration;
using System.Data; 
using System.Web.Security; 
using System.Web.UI.HtmlControls; 
using System.Web.UI.WebControls.WebParts;
using Word = Microsoft.Office.Interop.Word;
using System.IO;

namespace HtmlRegexImg
{
    public partial class docTOhtml : System.Web.UI.Page
    {
       
 
    protected void Page_Load(object sender, EventArgs e)
    {
        WordToHtml(Server.MapPath("/DocFile/")+"test.doc");
 
            string content="";
            StreamReader st = new StreamReader(Server.MapPath("/DocFile/") + "test.html", System.Text.Encoding.Default);

            content = st.ReadToEnd();//内容追加到ss中
   

    }
/// <summary>
/// word转成html
/// </summary>
/// <param name="wordFileName"></param>
private string WordToHtml(object wordFileName)
{
      //在此处放置用户代码以初始化页面
        Word.ApplicationClass word = new Word.ApplicationClass();
        Type wordType = word.GetType();
        Word.Documents docs = word.Documents;
        //打开文件
        Type docsType = docs.GetType();
        Word.Document doc = (Word.Document)docsType.InvokeMember("Open", System.Reflection.BindingFlags.InvokeMethod, null, docs, new Object[] { wordFileName, true, true });
        //转换格式,另存为
        Type docType = doc.GetType();
        string wordSaveFileName = wordFileName.ToString();
        string strSaveFileName = wordSaveFileName.Substring(0, wordSaveFileName.Length - 3) + "html";
        object saveFileName = (object)strSaveFileName;
        docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML });
        docType.InvokeMember("Close", System.Reflection.BindingFlags.InvokeMethod, null, doc, null);
        //退出 Word
        wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);
        return saveFileName.ToString();
}
}
        }

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
XDocReport是一个开源的Java库,用于将Word文档转换成HTML。使用XDocReport,我们可以通过编写Java代码来读取Word文档,提取其中的内容和格式,并将其转换成HTML格式。 要将Word文档转换成HTML,我们首先需要引入XDocReport库,并编写Java代码进行操作。下面是一个基本的示例: 1. 导入所需的库: ```java import fr.opensagres.xdocreport.converter.ConverterTypeTo; import fr.opensagres.xdocreport.converter.ConverterRegistry; import fr.opensagres.xdocreport.converter.Options; import fr.opensagres.xdocreport.core.XDocReportException; import fr.opensagres.xdocreport.document.IXDocReport; import fr.opensagres.xdocreport.document.registry.XDocReportRegistry; ``` 2. 加载Word文档: ```java IXDocReport report = XDocReportRegistry.getRegistry().loadReport(inputStream, TemplateEngineKind.Velocity); ``` 3. 创建转换选项: ```java Options options = Options.getFrom(ConverterTypeTo.HTML); ``` 4. 进行转换: ```java report.convert(outputStream, options); ``` 通过以上步骤,我们就可以将Word文档转换为HTML格式,并将结果输出到指定的输出流中。 需要注意的是,XDocReport提供了多种转换选项,可以根据需求进行配置,例如设置图片的输出格式、禁用某些功能等。 总结起来,使用XDocReport库可以很方便地将Word文档转换成HTML格式。通过编写Java代码,我们可以读取Word文档并进行相应的转换操作,最后将结果输出到指定的输出流中。这样,我们就可以实现将Word转换成HTML的功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值