利用C#提取PDF中的图片

nini！

已于 2024-01-31 16:39:27 修改

阅读量652

点赞数 9

文章标签： pdf c# visual studio .net

于 2024-01-19 13:59:08 首次发布

本文链接：https://blog.csdn.net/Gia2apo/article/details/135694048

版权

前言

PDF文档格式一直以其稳定的布局格式而广泛应用于各行各业。但也正因为如此，想要对其进行操作的话也有一定难度。一般而言都需要使用专门的PDF编辑器才能实现。如果您想要保存或再编辑PDF文档中的包含的图片，却没有编辑器的话，也可以通过编程来批量提取它们。下面是通过C#代码提取PDF中的图片的详细方法介绍。

准备工作

这个方法将用到的是Free Spire.PDF for .NET组件，支持在多种.NET平台上处理PDF。具体安装方法如下（Visual Studio 2022为例）：

方法一：

打开 Visual Studio创建新项目。
依次选择工具 > NuGet包管理器 > 程序包管理器控制台。
然后执行命令：PM > Install-Package FreeSpire.PDF

方法二：

将Free Spire.PDF for .NET 下载到本地，解压并安装。
打开Visual Studio创建一个新项目。
在“解决方案资源管理器”中右键点击“引用”，再依次选择“添加引用”> “浏览”。
找到安装路径下BIN文件夹中的dll文件，点击“OK”。

这里个人更推荐第二种方法，更方便查找各种demo。

还有一点需要注意的是，这个免费的组件在转换时有一定页数的限制。如果你的文档比较大，也可以直接下载商业版，申请一个临时许可证来试用一段时间。

下载链接：Spire.PDF for .NET

代码逻辑

首先创建一个PdfDocument 对象用于加载待提取的PDF文档。加载后，循环遍历该文档中的所有页面。然后使用 PdfPageBase下的ExtractImages() 方法来提取每个页面中的图像，并将其保存到指定的文件路径。

示例代码

using Spire.Pdf;
using System.Drawing;

namespace ExtractImages
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建PdfDocument对象
            PdfDocument pdf = new PdfDocument();

            //加载待提取的PDF文档
            pdf.LoadFromFile("Sample.pdf");

            int i = 1;
            //循环遍历文档中的所有页面
            foreach (PdfPageBase page in pdf.Pages)
            {
                //从每个页面提取图像并将其保存到指定的文件路径
                foreach (Image image in page.ExtractImages())
                {
                    image.Save(@"C:/Users/Administrator/Desktop/image/" + "Image" + i + ".png", System.Drawing.Imaging.ImageFormat.Png);
                    i++;
                    pdf.Dispose();
                }
            }
        }
    }
}

效果图

nini！

关注

9
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
利用C#提取PDF中的图片

PDF文档格式一直以其稳定的布局格式而广泛应用于各行各业。但也正因为如此，想要对其进行操作的话也有一定难度。一般而言都需要使用专门的PDF编辑器才能实现。如果您想要保存或再编辑PDF文档中的包含的图片，却没有编辑器的话，也可以通过编程来批量提取它们。下面是通过C#代码提取PDF中的图片的详细方法介绍。
复制链接

扫一扫