最简单的屏幕OCR文字识别

使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
适合用于识别比较规范的文本。缺点是必须安装office2003及Microsoft Document Imaging组件。

这种方法适合于普通文字识别,不太适合做验证码识别。
验证码识别请参考教程:http://www.yhhe.net/ape/book/fap/f2/ix.html

本程序使用了comx插件,请参考贴子:http://www.yhhe.net/bbs/dispbbs.asp?BoardID=4&ID=179&replyID =

下面是演示源代码:

下载模拟精灵: http://www.yhhe.net/Fairy_Ape.exe
打开模拟精灵 ,把下面的代码粘贴到源码编辑,按F5运行即可。

img = image.new( ) ;--创建一个图片对象
img:capture( 0 ,100 ,200 ,300 ,400 ) ;--抓屏,范围x=100,y=200,宽=300,高=400
img:save( _LASDIR.." // test.bmp" ) ; --保存图片到脚本目录(也就是_LASDIR)下
   
--导入comx插件
import( "std" ) ;
import2( "comx" ,"http://www.yhhe.net/ape/import/comx/comx.dll" ) ;
 
--创建MODI对象(必须安装office2003中的Microsoft Document Imaging组件)
mdoc = comx.CreateObject( "MODI.Document" ) ;
if ( not mdoc) then
    win.messageBox( "请将安装office2003及Microsoft Document Imaging组件" ,"屏幕ocr文字识别" )
    return
   false ;
end ;
 
--导入图片
mdoc:Create( _LASDIR.." // test.bmp" ) ;
--进行OCR识别,参数分别为语言ID,是否自动诱转,是否自动拉伸
mdoc:OCR( 0x804,_FALSE,_FALSE) ;
 
local mi = mdoc.Images( 0 ) ;
--快速获取取全部文本
win.messageBox( mi.Layout.Text,"mdoc.Images(0).Layout.Text" ) ;
 
--获取字符详细信息
local word = mi.Layout.Words( 0 )
local str =  "Id: " .. word.Id .. " /r /n "
   
str = str .. "Line Id: " .. word.LineId .. " /r /n " ;
str = str .. "Region Id: " .. word.RegionId .. " /r /n " ;
str = str .. "Font Id: " .. word.FontId .. " /r /n " ;
str = str .. "Recognition confidence: " .. word.RecognitionConfidence .. " /r /n " ;
str = str .. "Text: " .. word.Text;
 
win.messageBox( str,"mdoc.Images(0).Layout.Words(0)" )

mdoc:OCR 函数的第一个参数指定语言ID
在简体中文office中可选的语言ID有:

自动选择 0x800
英语 9
简体中文 0x804

在繁体中文office中可选的语言ID有:

自动选择 0x800
英语 9
繁体中文 0x404

正确的指定语言ID可以提高识别率。
如果mdoc:OCR 没有在图片中找到文字,会报错并终止模拟程序。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
共两卷,这是卷1,卷2不扣积分 这款软件的独特之处:除了具有一般同款软件的图片识别功能外,最独特的是,它可以像QQ截图一样,方便实用!目前流行的汉王、Readiris Pro 12、尚书、清华紫光、cajviewer等都不具备这个功能,它们都是需要将特定格式的文件导入软件界面、然后进行各种图像调整后才能进行识别,尽管每一款都号称是目前最强的,实际上,这几款的功能都差别不大。我们这一款软件,不敢说什么最强最大之类的话,只能说在识别准确率上会略优于上面提到的几款,因为它能对变形、光线不均、字迹模糊、带有背景图案的照片进行识别;而这款软件的最独特的地方,就是它的屏幕直接截图功能,所以它对要进行识别的文件格式没有任何限制,只要是能在电脑屏幕显示的图片,都可以直接截图识别。 也经过本人再三测试,可以完美运行在XP系统和VISTA、WIN7系统! 开发商意识到它潜在的巨大价值,所以已经不再独立发售软件,而是将这种技术开发了每台500元的名片识别机。可见这款软件和其它同款软件的与众不同。 功能详解: 核心功能:直接截取图像,把图像里的文字转换成文本文字(txt、doc等文本格式)。 强调1:“直接截取图像”的意思是,像QQ截图一样,直接截取当前屏幕的图像,极其方便! 强调2:这是本软件,优于市面上所有图像文字转换文本文字软件的,最大特征。 更强大的功能请往下看: 1、如果您喜欢某本纸质书籍或某篇文章,那么,只要用数码相机、手机或扫描仪将它拍下来,上传到电脑上,然后用该软件轻易的转换成文本文字; 2、您可以随时随地用数码相机、手机自由采集书籍、报刊、标牌、展板、名片及网页等各类文字图像,上传到电脑后就可以轻松的转成文本文字; 4、能够识别手写的文字,只要字迹不过于潦草,识别是没有问题的。 5、能将文简体、文繁体、文手写体、英文、韩文、日文的图像文字转换成文本文字。 6、能识别图片上的表格内容,将图片表格转换成文本表格。 7、操作极其简单:直接屏幕截图、一键转换。 8、瞬间完成识别,仅需几秒钟。 9、无需安装,下载后直接使用。 其它功能:鼠标手写功能。 只要用鼠标就能手写输入,识别性能很好,是打字慢或者不会打字人员的福音(如一些小孩父母爷爷奶奶)。 为了让您了解本软件的价值, 请花几分钟时间看完以下内容: (有点长,不喜欢看的可直接跳过) 1、本款软件在2007、2008年曾经公开出售过,售价是588元-880元,一机一码制(即每套软件只能在同1台电脑上使用),但目前已经基本绝版,开发商意识到这项技术的巨大价值,所以已经不直接卖软件,而是用这项技术开发了一款售价500元的识别纸质文字资料的图文识别机。 2、我们的这款软件是2007版的,2007版跟2008版功能基本相同,只是2008版在手写输入方面的功能更强。 3、因为知识产权方面的原因,这里不公布软件的具体名称。 5、如果您害怕花冤枉钱,那么请您先在网上搜索,看看能不能免费下载到像我们这款软件一样功能强大的图文转换软件,然后您再决定是否购买。 5、目前也有许多同类图像识别的软件,但是可以肯定的说,没有哪一款是具有直接屏幕截图后一键转换成文本的功能的,不信您可以去找一找。 6、如果您怀疑这款软件的功能,那么您可以先发一张图过来,我来帮您识别,看看效果如何。我们不是说肯定会让您满意(因为对于过于模糊、过于扭曲、过暗的、人眼识别起来都有困难的图像,这款软件也是无能为力的),但这样至少可以让您了解这款软件到底能不能满足您的要求。 7、使用方法可以详细看使用教程或咨询我,我已经有非常详细的使用教程。 本软件与其它图像识别软件的简要对比: 1、其它软件(以目前较流行的尚书7号、汉王等为例),使用时需将图像文件调入软件界面,然后必须根据软件的规则调整好位置方能进行识别;而我们这款软件根本没这么麻烦,直接像QQ截图一样截取图像,再点击识别按钮,几秒钟后就会弹出识别结果。 2、其它软件,尽管自称能识别多种图像格式、多种字体,但使用时你会发现,它们能识别的范围非常有限:基本只对扫描仪扫出的图像有效,图像里的文字必须很工整、必须很清晰、字体和背景的对比度必须足够高才能进行识别,对于较为弯曲、光线不足的、字迹模糊的、手写的图像文字,根本无法输出识别结果;而我们这款如软件却能在一定程度上克服了以上缺陷。可以看下面的识别例子。
共两卷,这是卷2,卷1:http://download.csdn.net/detail/puma1349/4628225 这款软件的独特之处:除了具有一般同款软件的图片识别功能外,最独特的是,它可以像QQ截图一样,方便实用!目前流行的汉王、Readiris Pro 12、尚书、清华紫光、cajviewer等都不具备这个功能,它们都是需要将特定格式的文件导入软件界面、然后进行各种图像调整后才能进行识别,尽管每一款都号称是目前最强的,实际上,这几款的功能都差别不大。我们这一款软件,不敢说什么最强最大之类的话,只能说在识别准确率上会略优于上面提到的几款,因为它能对变形、光线不均、字迹模糊、带有背景图案的照片进行识别;而这款软件的最独特的地方,就是它的屏幕直接截图功能,所以它对要进行识别的文件格式没有任何限制,只要是能在电脑屏幕显示的图片,都可以直接截图识别。 也经过本人再三测试,可以完美运行在XP系统和VISTA、WIN7系统! 开发商意识到它潜在的巨大价值,所以已经不再独立发售软件,而是将这种技术开发了每台500元的名片识别机。可见这款软件和其它同款软件的与众不同。 功能详解: 核心功能:直接截取图像,把图像里的文字转换成文本文字(txt、doc等文本格式)。 强调1:“直接截取图像”的意思是,像QQ截图一样,直接截取当前屏幕的图像,极其方便! 强调2:这是本软件,优于市面上所有图像文字转换文本文字软件的,最大特征。 更强大的功能请往下看: 1、如果您喜欢某本纸质书籍或某篇文章,那么,只要用数码相机、手机或扫描仪将它拍下来,上传到电脑上,然后用该软件轻易的转换成文本文字; 2、您可以随时随地用数码相机、手机自由采集书籍、报刊、标牌、展板、名片及网页等各类文字图像,上传到电脑后就可以轻松的转成文本文字; 4、能够识别手写的文字,只要字迹不过于潦草,识别是没有问题的。 5、能将文简体、文繁体、文手写体、英文、韩文、日文的图像文字转换成文本文字。 6、能识别图片上的表格内容,将图片表格转换成文本表格。 7、操作极其简单:直接屏幕截图、一键转换。 8、瞬间完成识别,仅需几秒钟。 9、无需安装,下载后直接使用。 其它功能:鼠标手写功能。 只要用鼠标就能手写输入,识别性能很好,是打字慢或者不会打字人员的福音(如一些小孩父母爷爷奶奶)。 为了让您了解本软件的价值, 请花几分钟时间看完以下内容: (有点长,不喜欢看的可直接跳过) 1、本款软件在2007、2008年曾经公开出售过,售价是588元-880元,一机一码制(即每套软件只能在同1台电脑上使用),但目前已经基本绝版,开发商意识到这项技术的巨大价值,所以已经不直接卖软件,而是用这项技术开发了一款售价500元的识别纸质文字资料的图文识别机。 2、我们的这款软件是2007版的,2007版跟2008版功能基本相同,只是2008版在手写输入方面的功能更强。 3、因为知识产权方面的原因,这里不公布软件的具体名称。 5、如果您害怕花冤枉钱,那么请您先在网上搜索,看看能不能免费下载到像我们这款软件一样功能强大的图文转换软件,然后您再决定是否购买。 5、目前也有许多同类图像识别的软件,但是可以肯定的说,没有哪一款是具有直接屏幕截图后一键转换成文本的功能的,不信您可以去找一找。 6、如果您怀疑这款软件的功能,那么您可以先发一张图过来,我来帮您识别,看看效果如何。我们不是说肯定会让您满意(因为对于过于模糊、过于扭曲、过暗的、人眼识别起来都有困难的图像,这款软件也是无能为力的),但这样至少可以让您了解这款软件到底能不能满足您的要求。 7、使用方法可以详细看使用教程或咨询我,我已经有非常详细的使用教程。 本软件与其它图像识别软件的简要对比: 1、其它软件(以目前较流行的尚书7号、汉王等为例),使用时需将图像文件调入软件界面,然后必须根据软件的规则调整好位置方能进行识别;而我们这款软件根本没这么麻烦,直接像QQ截图一样截取图像,再点击识别按钮,几秒钟后就会弹出识别结果。 2、其它软件,尽管自称能识别多种图像格式、多种字体,但使用时你会发现,它们能识别的范围非常有限:基本只对扫描仪扫出的图像有效,图像里的文字必须很工整、必须很清晰、字体和背景的对比度必须足够高才能进行识别,对于较为弯曲、光线不足的、字迹模糊的、手写的图像文字,根本无法输出识别结果;而我们这款如软件却能在一定程度上克服了以上缺陷。可以看下面的识别例子。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值