【教程】PDF开发工具Spire.PDF 教程：使用C＃从PDF中的特定矩形区域中提取文本

最新推荐文章于 2024-06-03 10:58:23 发布

cocacola456

最新推荐文章于 2024-06-03 10:58:23 发布

阅读量1.6k

点赞数

分类专栏：教程文档管理文章标签： PDF开发工具 PDF控件 PDF开发 Spire.PDF Spire.PDF教程

本文链接：https://blog.csdn.net/cocacola456/article/details/79034269

版权

文档管理同时被 2 个专栏收录

100 篇文章 1 订阅

订阅专栏

教程

58 篇文章 0 订阅

订阅专栏

Spire.PDF 是一个专业的PDF组件，能够独立地创建、编写、编辑、操作和阅读PDF文件，支持 .NET、WPF和Silverlight三个版本，本文介绍了如何通过Spire.PDF使用C＃从PDF中的特定矩形区域中提取文本。

使用Spire.PDF，程序员可以从PDF文档中的特定矩形区域提取文本，本文演示如何使用Spire.PDF和C＃实现此功能。

示例文件：

详细步骤：

Step 1: 初始化PdfDocument类的对象并加载PDF文件。

PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile("Stories.pdf");

Step 2: 获取第一页。

PdfPageBase page = pdf.Pages[0];

Step 3: 从页面中的特定矩形区域中提取文本，之后将文本保存为.txt文件。

string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());

输出：

完整代码：

//Initialize an object of PdfDocument class
PdfDocument pdf = new PdfDocument();
//Load the PDF file
pdf.LoadFromFile("Stories.pdf");

//Get the first page
PdfPageBase page = pdf.Pages[0];

// Extract text from a specific rectangular area within the page
string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );

//Save the text to a .txt file
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());

cocacola456

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【教程】PDF开发工具Spire.PDF 教程：使用C＃从PDF中的特定矩形区域中提取文本

Spire.PDF 是一个专业的PDF组件，能够独立地创建、编写、编辑、操作和阅读PDF文件，支持 .NET、WPF和Silverlight三个版本，本文介绍了如何通过Spire.PDF使用C＃从PDF中的特定矩形区域中提取文本。使用Spire.PDF，程序员可以从PDF文档中的特定矩形区域提取文本，本文演示如何使用Spire.PDF和C＃实现此功能。示例文件：详细步骤：S
复制链接

扫一扫