一款专为.NET开发者打造的OCR利器

2644fa8624c113469684024d8638d050.gif


引言

随着人工智能技术的飞速发展,OCR(光学字符识别)技术在我们的日常生活中扮演着越来越重要的角色。为了满足.NET开发者对于高效、便捷OCR工具的需求,今天推荐一款专为.NET开发者打造的OCR工具类库——PaddleOCRSarp

PaddleOCRSarp简介

PaddleOCRSarp充分利用了百度飞桨PaddleOCR的强大功能,通过C++代码修改和封装,为.NET开发者提供了一个简单易用、功能强大的OCR工具类库。无论是文字识别、车牌识别还是表格识别,PaddleOCRSarp都能轻松应对,帮助开发者快速实现OCR功能。

PaddleOCRSharp封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。

本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,请设置OCR识别参数OCRParameter对象的属性rec_img_h=32,本项目默认使用V3模型,默认rec_img_h=48:

本项目只能在X64的CPU上编译和使用,只能在avx指令集上的CPU上使用。

本项目目前支持以下.NET框架:

net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481;
netstandard2.0;netcoreapp3.1;
net5.0;net6.0;net7.0;net8.0

PaddleOCRSarp特点

  • • 高度集成PaddleOCRSarp将百度飞桨PaddleOCR的核心功能完美集成到.NET平台,让开发者无需关心底层实现,只需调用相应接口即可实现OCR功能。

  • • 性能卓越:得益于百度飞桨PaddleOCR的高效算法和C++代码的优化,PaddleOCRSarp在保持高度集成的同时,也保证了卓越的性能表现。

  • • 易于使用PaddleOCRSarp提供了丰富的API接口和详细的文档说明,让开发者能够轻松上手,快速实现OCR功能。

  • • 扩展性强PaddleOCRSarp支持自定义模型加载和训练,开发者可以根据自己的需求进行模型扩展和优化。

PaddleOCRSarp源码文件夹结构

PaddleOCRSharp               //该文件夹包含.NET对PaddleOCR封装类库项目
PaddleOCRDemo                //该文件夹包含OCR示例Demo文件夹
|--PaddleOCRCppDemo          //C++调用示例项目
|--PaddleOCRSharpDemo        //.NET调用示例项目
|--python                    //python调用示例项目
|--Go                       //Golang调用示例项目

PaddleOCRSarp应用场景

PaddleOCRSarp适用于各种需要OCR技术的.NET开发场景,如文档数字化处理、自动识别表单数据、车牌识别等。无论是企业级应用还是个人开发者,PaddleOCRSarp都能提供强大的OCR支持。

如何开始使用

要开始使用PaddleOCRSarp,只需按照以下步骤操作:

下载并安装PaddleOCRSarp库

在您的.NET项目中引入PaddleOCRSarp库;

调用PaddleOCRSarp提供的API接口进行OCR操作;

根据需要自定义模型或调整参数。

OCR识别示例

OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
 if (ofd.ShowDialog() != DialogResult.OK) return;
 //使用默认中英文V4模型
 PaddleOCRSharp.OCRModelConfig config = null;
 //使用默认参数
PaddleOCRSharp. OCRParameter oCRParameter = new PaddleOCRSharp.OCRParameter();
//识别结果对象
 PaddleOCRSharp.OCRResult ocrResult = new PaddleOCRSharp.OCRResult();
 //建议程序全局初始化一次即可,不必每次识别都初始化,容易报错。     PaddleOCRSharp.PaddleOCREngine engine = new PaddleOCRSharp.PaddleOCREngine(config,  oCRParameter);
 {
ocrResult = engine.DetectText(ofd.FileName);
 }
 if (ocrResult != null) MessageBox.Show(ocrResult.Text, "识别结果");

表格识别示例

public void Test()
{
OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
f (ofd.ShowDialog() != DialogResult.OK) return;
            
//模型配置,使用默认值
StructureModelConfig structureModelConfig = null;
            
  //表格识别参数配置,使用默认值
StructureParameter structureParameter = new StructureParameter();
 //初始化表格识别引擎
 PaddleStructureEngine engine = new PaddleOCRSharp.PaddleStructureEngine(null, structureParameter);
 //表格识别,返回结果是html格式的表格形式
 string result = engine.StructureDetectFile(ofd.FileName);
  //添加边框线,方便查看效果
 string css = "<style>table{ border-spacing: 0pt;} td { border: 1px solid black;}</style>";
 result = result.Replace("<html>", "<html>" + css);
//保存到本地
 string name=Path.GetFileNameWithoutExtension(ofd.FileName);
if (!Directory.Exists(Environment.CurrentDirectory + "\\out"))
{ Directory.CreateDirectory(Environment.CurrentDirectory + "\\out"); }
string savefile = $"{Environment.CurrentDirectory}\\out\\{name}.html";
File.WriteAllText(savefile, result);
           
//打开网页查看效果
Process.Start("explorer.exe", savefile);
 }

结语

PaddleOCRSarp作为一款基于百度飞桨PaddleOCR的.NET OCR工具类库,为.NET开发者提供了强大的OCR功能支持。还有更多好玩的内容,感兴趣的自行去体验吧。

源码地址

https://gitee.com/raoyutian/paddle-ocrsharp


推荐阅读
  1. 1. 工控行业福音:C#开发的桌面神器,助力调试更高效

  2. 2. 一个基于.net6开发的复杂报表工具

  3. 3. 一个用于.NET的高性能MQTT类库

  4. 4. 高性能异步事件驱动的网络应用程序框架

  5. 5. 使用C#开发的两款物联网明星项目

  6. 6. 使用C#编写的Modbus TCP/RTU主从通信开源工具

  7. 7. 一套开源的WPF控件库新宠,引领界面设计新潮流

  8. 8. 一个使用C#开源的工业物联网边缘计算桌面神器!1.5kstar关注

  9. 9. 中小型企业福音:一款开源的全平台C-S开发框架


欢迎扫描下方二维码加我的微信,获取更多技术解决方案并入群交流

6d90e526f43e8461eee9d8f219df2349.jpeg

版权声明:本文来源于网络素材收集整理或网友供稿,版权归版权所有者所有,如有侵权请联系小编予以删除

39ac816cda75a087fdb22e1f7e436e21.gif

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值