1、NPOI DLL 下载,现在https://archive.codeplex.com/?p=npoi 只能下载源码
百度了一下 用VS 的Nuget 下载,VS2010 工具 外部扩展器 Nuget package manager 下载 安装 重启
2、新建项目 WordFileRead 在解决方案资源管理器 下引用,右键,管理Nuget程序包(N) 搜索NPOI 安装,在项目文件夹下
package 下对应文件夹有NPOI的DLL。
3、添加引用,编写按段落读取
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.Data;
using System.Reflection;
using Microsoft.Office.Interop.Word;
using System.IO;
using NPOI.XWPF.Model;
using NPOI.XWPF.Extractor;
using NPOI.XWPF.UserModel;
using NPOI.OpenXmlFormats.Wordprocessing;
namespace WordFileRead
{
class Program
{
[STAThread]
static void Main(string[] args)
{
OpenFileDialog ofd = new OpenFileDialog();
ofd.InitialDirectory = "";
ofd.Filter = "Word文件|*.docx";
ofd.Multiselect = true;
string[] WordUrl;//数据源路径集合
DialogResult r = ofd.ShowDialog();
if (r == DialogResult.OK)
{
WordUrl = ofd.FileNames;
}
else
{
return;
}
for (int i = 0; i < WordUrl.Length; i++)
{
string wordFile = "";
wordFile = WordUrl[i];
Stream stream = File.OpenRead(wordFile);
XWPFDocument doc = new XWPFDocument(stream);
foreach (var para in doc.Paragraphs)
{
string text = para.ParagraphText; //获得文本
if(text.Trim()!="")
Console.WriteLine(text);
}
}
Console.ReadLine();
}
}
}