早期版本的Microsoft Word以.doc扩展名的二进制格式保存文档。在Office 2007发行版中,Microsoft采用了Office Open XML(OOXML),该格式基于XML和二进制文件的组合,这些文件与ZIP归档文件结合在一起。Word现在使用.docx作为保存文档的默认扩展名。
将PDF转换为Word DOC
用于.NET的Aspose.PDF可让您使用简单的代码行将PDF文件读取并转换为 .NET应用程序中的Word文档。可以使用C#和其他.NET编程语言在.NET WinForms和ASP.NET应用程序中使用该API 。
// 文档目录的路径。 string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); //打开源PDF文档 Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf"); //将文件保存为MS文档格式 pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
将PDF转换成DOCX
如先前所示,将PDF转换为DOCX类似于将文件转换为DOC文件格式。该API具有DocSaveOptions类,除了将文档格式设置为DocX之外,该类还允许您设置其他选项。
// 文档目录的路径。 string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); //打开源PDF文档 Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf"); // 实例化DocSaveOptions对象 DocSaveOptions saveOptions = new DocSaveOptions(); //将输出格式指定为DOCX saveOptions.Format = DocSaveOptions.DocFormat.DocX; // 以docx格式保存文档 pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);