openxml html to word,使用openxml提取word中的文本和图片并转为Html

C# Net Core openxml 提取 提出 取 word  文本  图片 Html Text Drawing

C# Net Core openxml 提取 提出 取 word  文本  图片 Html Text Drawing

注:只支持内嵌,不支持公式

------------------------------------------------

---------------文章最后为效果------------

------------------------------------------------

加入包:OpenXml

创建文件:Read.cs

复制下面全部代码到文件 Read.cs

using DocumentFormat.OpenXml;

using DocumentFormat.OpenXml.Packaging;

using DocumentFormat.OpenXml.Wordprocessing;

using System;

using System.Collections.Generic;

using System.IO;

using System.Text;

using System.Xml;

using System.Xml.Xsl;

namespace YCBX.Office.WordXml

{

public class WordRead

{

public static List ReadToHtml(string wordPathStr)

{

return ReadToHtml(new FileStream(wordPathStr, FileMode.Open));

}

public static List ReadToHtml(Stream wordStream)

{

using (WordprocessingDocument doc = WordprocessingDocument.Open(wordStream, false))

{

//XmlWriterSettings settings = new XmlWriterSettings() { OmitXmlDeclaration = true, ConformanceLevel = ConformanceLevel.Auto,DoNotEscapeUriAttributes=true};

List paragraphHtmls = new List();

MainDocumentPart mainPart = doc.MainDocumentPart;

Body body = doc.MainDocumentPart.Document.Body;

//段落

foreach (var paragraph in body.Elements())

{

StringBuilder paragraphHtml = new StringBuilder();

//块

foreach (var run in paragraph.ChildElements)

{

if (run is Run)

{

foreach (OpenXmlElement openXmlElement

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值