怎样使用OneNote的COM组件,来实现OCR功能?下面详解

背景

  在业务系统开发的过程中,很多情况下会去识别图片中的相关信息,并且把信息录入到系统中。现在希望通过自动化的方式录入,就有了以下的工作。在对比了几个OCR软件在中文识别方面的准确率后,决定使用微软的OneNote开发相应的功能。

  准备工作

  安装OneNote 2010;(注:在 Microsoft Office 2003 中的工具组件中有一个“ Microsoft Office Document Imaging”的组件包,之后的Office版本将这个功能集成到OneNote中了)

  查询网上相关OneNote的资料,真是少得可怜,即使找到现有的代码也是各种坑。

 

  在OneNote中的图片识别功能如下图,把图片放到一个tab中,右键图片就会出现红框所标注的功能,这个是我需要在程序中来调用的:

  代码实现的逻辑

  获取图片的Base64编码;

  开启OneNote程序,在一个空的newfile.one中,生成一个新的page;

  此时,新的page页中,会有一个固定格式的xml,把图片的Base64编码,更新到对应的节点上;

  更新节点后,会自动调用OCR的功能,把识别出来的文字,放入到固定节点上;

  从识别出来的文字节点上,取出相应的文字就可以了;

  彻底销毁当前的页面(如果不是彻底的话,这个newfile.one会越来越大);


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值