中的图片文字识别_识别图片中公式和文字的最佳组合:天若文字识别和Mathpix...

fc997381c5cca6cb86c068873c6195bf.png

谢松兴 蒙宗灿 盘俊春 广西南宁市第八中学

发表于《中国信息技术教育》杂志2020年22期

    教师们都碰到过想要从图片中把需要的文字复制到可编辑的Word文档中的情况。常用的解决办法有以下几种,但各有缺点:①全手工键盘录入,这种方法费时费力,易出错;②通过讯飞输入、袋鼠输入等语音识别APP或软件录入,但通过语音转文字方式,需要普通话相对标准识别率才比较高;③利用QQ截图文字识别或微信小程序,如传图识字等小工具,联通网络后拍照上传识别,再通过计算机逐行选择文字复制,最后发送到Word里进行编辑,但缺点是不能一次选择全文识别,而且要兼顾手机和计算机两方面操作,流程复杂,效率不高;④利用专业的软件,如风云PDF转换器、WPS会员版等进行识别转换,这种方法相对省事,但是费用不低。那么有没有免费的识别中英文,理科公式的软件呢?今天就介绍两款十分出色的OCR识别工具:天若文字识别软件和Mathpix。

    ● 天若文字识别的主要功能及特点

    天若文字识别是一款文字智能识别软件,拥有图片识别、PDF识别、屏幕取色、屏幕录像、截图、贴图、录制GIF、文本翻译和段落排版等功能。专业版还增加了识别竖排、识别公式、识别表格、识别三线表、倾斜矫正等一系列功能,可以减少重复劳动,提高工作效率。

天若文字识别的下载地址是https://www.pcsoft.com.cn/soft/175155.html。下载安装好后打开的界面如图1所示。

30003f94c5d37f8997a9111c18ae2e22.png    

图1 天若文字识别界面

天若文字识别界面很简单,软件有以下主要功能及特点。

(1)图片识别:将JPG、BMP、PNG、TIF等格式图片识别为TXT;高效地识别各类复杂字体。

(2)PDF识别:支持对普通PDF文件、PDF扫描件、加密的PDF文件进行扫描识别。

(3)文字识别后再加工的功能很强大,具有如置顶功能、字体功能和朗读功能等十多项文字编辑功能。

    ● 利用天若文字识别工具进行图片文字转换

    天若文字识别简单易用,使用之前先确保计算机处于网络联接状态。具体操作步骤如下。

(1)单击软件图标启动软件,在计算机右下方对着天若软件图标双击鼠标左键开始截图识别功能,如图2所示。

8fcd7eec13deb751b9087cea4d8407d3.png    

图2 天若软件启动

(2)利用十字形标志的光标选定预识别PDF文档或者图片形式的文档,可以一次选择一整页A4纸张,也可以根据需要按段落或者几行文字选择好,截图之后松开左键即可完成识别。段落识别图片,越清晰越准确,识别率高达98%。

(3)识别好的中文或英文及一些公式在天若软件中以记事本形式呈现,识别速度由计算机使用网络情况而定,一般1~6秒即可完成。

(4)在天若软件工具栏,可以对转化好的文字进行适当的排版,包括字体、颜色、加粗、错别字识别,自动分栏操作,工具栏还有很多强大功能,包括中英文翻译,朗诵录音等。

(5)把识别好的中文、英文或理科公式,复制到Word文档中,加以自主编辑使用即可,文字识别完毕如图3所示。

7318eb383739a0d524204532208aabd6.png    

图3 天若文字识别后中英文对照功能展示‍

    总之,天若文字识别软件对中英文识别效果好,易操作,识别成功率高,能力强大,基本上可以满足文科教师的所有要求,唯一遗憾的是它对图画插图识别不能够直接引用成插图原图。

    天若文字识别软件虽然对中英文识别成功率高,但是对理科公式识别会出现乱码,不能直接复制利用(如图4),因此很多教师只能利用打开公式编辑器通过手工录入的方法录入公式。

49ff2f83aa25f9e431fd679df469a26b.png    

图4 天若软件对理科文档识别效果

    有什么方法可以帮助理科教师快速录入公式和理科符号,提高工作效率呢?下面推荐理科公式精准识别的利器——Mathpix。

    ● Mathpix的主要功能及特点

    Mathpix是一款OCR公式识别工具,界面美观大方,功能实用。下载地址:http://www.downza.cn/soft/275117.html。

    使用Mathpix前,首先要在官网上注册帐号,每个注册账号每个月可以免费使用500次,图5所示为注册界面。

8ae8cf56a3e808b2a120e14755785294.png    

图5 Mahpix软件注册界面

    Mathpix有以下主要功能及特点。

(1)能够直接截取数学公式的图片,转换为LaTeX语法,非常简单方便,并且支持苹果、Windows、Linux三大主流系统。

(2)可以截图识别中文和公式。

(3)可以先手写证明过程中的公式等信息,再用手机拍照上传至计算机端,通过软件截图,识别公式然并将其转换成LaTeX编辑器的代码。

● 利用Mahpix软件识别PDF格式的数学试卷转换成Word格式

    Mathpix简单易用,具体操作步骤如下。

(1)启动Mahpix软件:通过键盘快捷键启动,苹果计算机上是b1c7ff43f6723275a01403567d342411.png、在Windows和Linux上是Ctrl+Alt+M,图6所示为软件启动界面。

60e243159b7fccde71521f44bda32165.png    

图6 Mahpix软件启动界面

(2)利用Mahpix软件捕获公式:在待转换PDF文档或者图片里,鼠标左键单击选定区域,拖动松开左键即可完成捕获。图7所示为截图识别后的效果。

fe2a41d71dbfa38986c11c15edd2ea65.png    

图7 Mahpix软件截图识别效果图‍

(3)编辑:中文可以全识别,数学公式以Latex代码格式呈现,很容易从任务栏直接选择所需的格式,若需要在Word文档中对识别后的文件进行加工,点击Copy MS Word按键即可对文档全选复制、编辑等。

(4)粘贴:将Latex代码导入任一兼容的编辑器,最后粘贴到Word文档的效果如图8所示。

12cf71e1fd052fc93778a481efce3c0d.png    

图8 Word中复制粘贴后代有最后Latex代码‍

(5)Latex代码转变为数学编辑器MathType中的公式:将Latex代码复制粘贴到数学公式编辑器MathType中实现公式最后转换,然后把多余的符号文字引用符等去掉就直接可以使用。图9所示是复制到Word后的界面。

c3595773ae7bd5bf01d656aff1b85289.png    

图9 把公式复制到数学公式编辑器MathType界面

    总之,两款软件各有专长,天若文字识别对中英文文档识别效果好,Mahpix软件对理科公式识别转换效果好,经过识别,PDF文档和图片公式里的文字和公式都能在Word文档中加工编排,完美解决了手工输入的低效率和费时费力的问题。

[项目:本文为广西教育科学“十三五”规划2019年度课题“‘互联网+’背景下大数据与云计算技术工具与学科教学融合的实践研究”(课题编号:2019C429)的阶段性研究成果。]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值