我知道有很多问题有相同的标题,但我目前遇到一些问题,我没有得到正确的方法。
我正在使用Open xml sdk 2.5和Power tool将.docx文件转换为使用.html类进行转换的HtmlConverter文件。
我已成功将docx文件转换为Html文件,但问题是,html文件不保留文档文件的原始格式。例如。 字体大小,颜色,下划线,粗体等不会反映到html文件中。
这是我现有的代码:
public void ConvertDocxToHtml(string fileName)
{
byte[] byteArray = File.ReadAllBytes(fileName);
using (MemoryStream memoryStream = new MemoryStream())
{
memoryStream.Write(byteArray, 0, byteArray.Length);
using (WordprocessingDocument doc = WordprocessingDocument.Open(memoryStream, true))
{
HtmlConverterSettings settings = new HtmlConverterSettings()
{
PageTitle = "My Page Title"
};
XElement html = HtmlConverter.ConvertToHtml(doc, settings);
File.WriteAllText(@"E:\Test.html", html.ToStringNewLineOnAttributes());
}
}
}
所以我只想知道是否有任何方法可以保留转换后的HTML文件中的格式。
我知道一些做同样事情的第三方API。但我更喜欢使用open xml或任何其他开源来做这件事。