LEADTOOLS Recognition Imaging SDK是精选的LEADTOOLS SDK功能集,旨在在企业级文档自动化解决方案中构建端到端文档成像应用程序,这些解决方案需要OCR,MICR,OMR,条形码,表单识别和处理,PDF,打印捕获 ,档案,注释和图像查看功能。 这套功能强大的工具利用LEAD屡获殊荣的图像处理技术,智能识别可用于识别和提取任何类型的扫描或传真形式图像数据的文档功能。
点击下载LEADTOOLS Recognition Imaging SDK试用版
有许多原因可能导致您想要与PDF文档进行转换。也许您需要使PDF可编辑或文本可搜索。或者,也许您更希望PDF是DOC或DOCX文件,但是您不想复制/粘贴文本或丢失原始格式。您甚至可能需要以相同的方式批量转换大量PDF。好消息!该 LEADTOOLS文档转换器SDK 是一个简单的工具能够处理所有的文档和图像转换的需求结合起来。
在后台,Document Converter使用人工智能来选择LEADTOOLS Raster, SVG, OCR和 Document Writer 技术的正确组合, 以快速而精确地转换图像和文档。
在接下来的几周中,我们将通过向您展示如何在特定格式之间进行转换,来证明我们的文档转换技术的多功能性。今天的博客重点介绍如何将PDF转换为Word格式(DOC / DOCX)。
在C#中将PDF转换为DOC或DOCX
使用LEADTOOLS轻松将PDF转换为Word(DOC / DOCX)文档。下面的示例使用C#,但是LEADTOOLS支持其他几种语言,包括Java和VB。首先,导入LEADTOOLS SDK。
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Document.Converter;
using Leadtools.Document.Writer;
using Leadtools.Ocr;
然后,初始化文档转换器。
namespace Convert_Files_with_Document_Converter
{
class Program
{
static void Main(string[] args)
{
string directory = @"C:\InputFileDirectory";
SetLicense();
using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
using (DocumentConverter docConverter = new DocumentConverter())
{
ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS21\Bin\Common\OcrLEADRuntime");
docConverter.SetOcrEngineInstance(ocrEngine