NPOI 简介
是一个国人的OFFICE SDK. 是POI的.NET版
设计目的是用于处理word,excel,ppt中的文本,还可以提取图片文件中的图片等。
不支持mathtype, mathml,等数学公式的提取,公式会被提取为图片。
当然也可以用来生成简单的word,excel,ppt.
读取方法
using (FileStream stream = File.OpenRead(fileName))
{
//文档对象
XWPFDocument doc = new XWPFDocument(stream);
//文档中全部的图片。(包括mathtype公式)
var allPics = doc.AllPictures;
foreach (XWPFParagraph paragraph in doc.Paragraphs)
{
//提取每一行的文本
string lineText = paragraph.Text;
foreach (var item in paragraph.Runs)
{
foreach (var pic in item.GetEmbeddedPictures())
{
//当前文本中的图片
var pciData = pic.GetPictureData();
MemoryStream ms = new MemoryStream(pciData.Data);
Image img = Image.FromStream(ms);
img.Save(name);
}
}
}
}