作者Krishnan 2006年2月27日
这个教程适合C#初学者。改文描述如何使用C#读取Word文档。
我们通常使用FileStream读取text文件的内容。但是我们不能使用相同的方法来读取Word文档的内容。
我们必须使用叫做”Microsoft Word 9.0 object library”的Microsoft COM组件。该组件提供的类和方法来读取Word文档。
我们使用其中的Word.ApplicationClass来访问word运用。
我们下面的例子将在内存中打开word文档。复制所有的内容到剪贴板。接着从剪贴板获取数据。
代码如下:
Word.ApplicationClass wordApp=new ApplicationClass();
object file=path;(//译注:这个path是函数的参数,表示Word的路径)
object nullobj=System.Reflection.Missing.Value;
Word.Document doc = wordApp.Documents.Open(
ref file, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj);
doc.ActiveWindow.Selection.WholeStory();
doc.ActiveWindow.Selection.Copy();
IDataObject data=Clipboard.GetDataObject();
txtFileContent.Text=data.GetData(DataFormats.Text).ToString();
doc.Close();