LEADTOOLS 入门教程: 使用文件观察器转换文件 - C# .NET Core

LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。

LEADTOOLS 最新下载(qun:731259648)https://www.evget.com/product/782/download

本教程展示了如何使用System.IO.FileSystemWatcher该类在创建目录中的文件时引发事件,以及如何使用DocumentConverter该类将文件转换并保存为可搜索的 PDF 文件格式。

概述
概括本教程介绍如何在 C# .NET Core 控制台应用程序中使用DocumentConverter和System.IO.FileSystemWatcher类将文件转换为可搜索的 PDF。
完成时间30分钟
视觉工作室项目下载教程项目 (2 KB)
平台C# .NET Core 控制台应用程序
集成开发环境视觉工作室 2019、2022
开发许可下载 LEADTOOLS
用另一种语言试试

所需知识

在使用文件观察器转换文件 - C# .NET Core教程之前,通过查看添加引用和设置许可证教程熟悉创建项目的基本步骤。

创建项目并添加 LEADTOOLS 引用

从添加引用和设置许可证教程中创建的项目副本开始。如果您没有该项目,请按照该教程中的步骤创建它。

所需的参考取决于项目的目的。可以通过 NuGet 包添加引用。

本教程需要以下 NuGet 包:

  • Leadtools.Document.Sdk

有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅要包含在您的应用程序中的文件。

设置许可证文件

许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。

有两种类型的运行时许可证:

  • 评估许可证,在下载评估工具包时获得。它允许评估工具包。
  • 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。

笔记

添加 LEADTOOLS NuGet 引用和设置许可证在添加引用和设置许可证教程 中有更详细的介绍。

添加 FileSystemWatcher 和 DocumentConverter 代码

创建项目、添加参考和设置许可证后,就可以开始编码了。

解决方案资源管理器中,打开Program.cs。将以下语句添加到using顶部的块中Program.cs。

【C#】

using System;
using System.IO;
using Leadtools;
using Leadtools.Document;
using Leadtools.Document.Converter;
using Leadtools.Document.Writer;
using Leadtools.Ocr;

将以下全局变量添加到Program类中。

【C#】

static string OutputDirectory;
static DocumentConverter docConverter;

在 Main 方法中添加以下代码以初始化OcrEngine、DocumentConverter和FileSystemWatcher对象。

【C#】

static void Main(string[] args)
{
if (args.Length != 1)
{
Console.WriteLine("Usage: Convert-Files-With-a-File-Watcher.exe <directory>");
return;
}

if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");

using (IOcrEngine OcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
{
OcrEngine.Startup(null, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime");

docConverter = new DocumentConverter();
docConverter.SetOcrEngineInstance(OcrEngine, false);
docConverter.SetDocumentWriterInstance(new DocumentWriter());

string watchFolder = args[0];

OutputDirectory = Path.Combine(watchFolder, "ConvertedToPDF");
if (!Directory.Exists(OutputDirectory))
Directory.CreateDirectory(OutputDirectory);

Console.WriteLine($"Watching folder {watchFolder}..");

using (FileSystemWatcher systemWatcher = new FileSystemWatcher())
{
systemWatcher.Path = watchFolder;
systemWatcher.NotifyFilter = NotifyFilters.LastAccess
| NotifyFilters.LastWrite
| NotifyFilters.FileName
| NotifyFilters.DirectoryName;

systemWatcher.Filter = "*.*";

systemWatcher.Created += SystemWatcher_Created;

systemWatcher.EnableRaisingEvents = true;

Console.WriteLine("Press 'q' to quit.");
while (Console.Read() != 'q') ;
}
}
}

笔记

因为IOcrEngine接口实现了IDisposable,所以确保它在using声明中以便正确处理。

创建一个名为 的新方法ConvertFile(string input, string output)。此方法将在FileSystemWatcher.Create事件处理程序内部调用。在新方法中添加以下代码,将指定文件目录中的新文件转换为PDF。

【C#】

private static void ConvertFile(string input, string output)
{
var inputDocument = DocumentFactory.LoadFromFile(input, new LoadDocumentOptions());

DocumentConverterJobData jobData = new DocumentConverterJobData()
{
Document = inputDocument,
OutputDocumentFileName = output,
DocumentFormat = DocumentFormat.Pdf,
};

var job = docConverter.Jobs.CreateJob(jobData);
docConverter.Jobs.RunJob(job);

if (job.Errors.Count > 0)
foreach (var converterJobError in job.Errors)
Console.WriteLine($"Error During Conversion:{converterJobError.Error.Message}");
else
Console.WriteLine($"Converted {input} to PDF. Save location: {output}");
}

创建FileSystemWatcher.Create事件处理程序。将此事件处理程序挂接到Main()方法中,如上所示。将以下代码添加到事件处理程序以收集输入文件路径、创建输出文件路径并调用ConvertFile()上面创建的方法。

【C#】

static void SystemWatcher_Created(object sender, FileSystemEventArgs e)
{
string file = e.FullPath;
string output = Path.Combine(OutputDirectory, Path.ChangeExtension(e.Name, "pdf"));

ConvertFile(file, output);
}

运行项目

需要在Application arguments中指定要添加 File Watcher 的目录。要添加目录,请选择项目 ->特性,然后导航到“调试”选项卡。

一旦指定了要将文件观察器添加到的目录,按F5或选择Debug -> Start Debugging运行项目。

如果正确执行了这些步骤,则会出现控制台,并且应用程序会侦听添加到指定文件目录的任何新文件。添加文件后,应用程序会抓取该文件并将其转换为可搜索的 PDF。

以上便是 使用 AWS Lambda 转换文档 ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。

LEADTOOLS Imaging Pro SDK是一个支持150多种光栅图像格式(JPEG,GIF,TIFF...)的应用程序接口(API) 、C++类库、 ActiveX与VCL的工具箱;拥有超过2000种图像处理效果、图像变换及过滤、多种加载与观察选项、TWAIN扫描、打印、微型浏览器、Internet及数据库成像功能、压缩、屏幕捕获、绘图、颜色转换、Internet/intranet成像、图形转换、共用对话框等;同时也包括开发者所需要的集成绘图功能以及应用中的数字绘图功能。 0 特征综述 About Feature 声明:本产品中文介绍为慧都控件网版权所有,未经慧都公司书面许可,严禁拷贝、转载! 文件格式支持 采用工业标准和专有压缩技术,可同时支持150多种图像文件格式以及sub-格式的加载、保存和转换。另外,采用LEADTOOLS能添加更多的格式支持,例如采用LEADTOOLS PDF插件,即能实现对PDF文件的加载、保存和转换支持。 压缩支持 支持多种工业标准的压缩技术,包括JPEG、CCITT、LZW (使用于GIF及某些TIFF文件)、ZIPLIB (使用于PNG文件)、Huffman算法、RLE及紧缩位压缩算法(Packbits)。另外,采用LEADTOOLS JPEG2000 插件和 LEADTOOLS CMW 插件可添加JPEG2000 及先进的CMW压缩技术。 TWAIN扫描支持 TWAIN 驱动几乎包含在所有的扫描仪及其它图像采集设备中,同时随着最新的发展技术,TWAIN 也是性能良好与高可靠性驱动的最佳选择。当前LEADTOOLS 的光栅图像产品支持所有包括在TWAIN v1.9 规范中的功能。 屏幕捕获 具有强大的屏幕捕获功能,能从文件、菜单、窗口、不同形状的屏幕客户区域等捕获资源。屏幕捕获工具是极其有用的,特别是在文档编辑及需提供其它图像输入方式的时显得更为重要。 数据库支持 同时提供高端或低端的数据库支持,其中包括绑定VB数据控件功能、OLEDB 接口、ODBC 接口以及低端加载和保存图像到内存的功能。 Internet 支持 提供几种不同级别Internet支持,包括:可封装到CAB文件的对象、能在web服务器端构造的对象、从URL或存储器装载图像的功能、支持HTTP 和FTP的控件、解析并加载到web服务器端的文件控件,以及用来构造功能强大、通过TCP/IP发送远程过程调用的客户服务器应用程序控件。 图像优化 基于具体优化选项,LEADTOOLS 提供了某些优化图像文件格式以及通过保存图像时使用合适的每个像素所占用的位来减小图像文件大小的功能。 显示与显示效果 对图像如何被显示进行完全地控制,包括缩放、展开、图像显示的区域控制以及超过2000种的特效效果。LEADTOOLS 甚至包含了一个平铺窗口,这样你能方便地显示图像概要及选用适合最终用户的卷起、平铺方案。 打印支持 由于能使用与显示图像同样的代码来进行打印,所以打印图像与显示图像同样容易。你能控制图像打印的尺寸和位置;另外,能结合Windows GDI函数同LEADTOOLS打印一起使用,提供在同一页上打印文本和多个图像的灵活性。 图像处理 超过200种图象处理功能,分为四个基本类别:过滤、变换、色彩转换及绘图。在LEADTOOLS中的大多数图像处理功能支持不同着重区域,允许图像的某一部份被处理。通过添加更多用于数字绘图的功能,LEAD在LEADTOOLS Raster Imaging Pro中提供了包含大量用于数字绘图功能,包括笔刷、形状、纹理的创建与使用以及更多。 色彩转换 为确保你能把图像从一种格式转换到另一种格式,或是在任何其它显示设备上显示图象,LEADTOOLS 包含了强大的色彩转换功能。该色彩转换功能包括:支持8 种以上色彩平滑过渡算法、多种调色板选项以及把图像数据从任何支持的每个像素所占用的位转换到其他支持的每个像素所占用的位功能。支持的数值有1-8位色或灰度、16位色、24 位色和32 位色。如果你需要12或16位灰度或48与64位色支持。 图像公共对话框 LEADTOOLS 图像公共对话框通过扩展Windows公共对话框以提供具体的图像处理功能,节省了大量的繁琐编程时间,同时能给最终用户提供一个一致的外观和感觉。这个公共对话框针对图像处理、变换及特效提供专业的图像公共对话框功能。 数字绘图 数字绘图是任何想给应用程序增加数字绘图功能所必须的。使用 LEADTOOLS 的数字绘图特性,开发者可以创建一个完整的图像编辑或设计应用程序,也可简单地添加这些功能的一部分到现有的应用程序中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值