用于.NET的Aspose.PDF提供了出色的转换选项,可以将PDF文件转换为DOC,DOCX,图像,HTML和其他各种格式。在PDF到HTML的转换过程中,默认情况下,PDF中的图像通过SVG压缩保存。您可以将它们保存为光栅格式(PNG或JPEG)以减小图像尺寸。
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat;
//源PDF文件
Document doc = new Document(dataDir + "input.pdf" );
//使用测试的功能创建HtmlSaveOption
HtmlSaveOptions saveOptions = new HtmlSaveOptions;
saveOptions.FixedLayout = true ;
saveOptions.SplitIntoPages = false ;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
//将输出保存为HTML格式
doc.Save( dataDir + "SaveImages_out.html" , saveOptions);