程序员的数学 pdf_InftyReader识别数学公式--布局分析和公式校正

b950d43d67ae09892913eb8ae793f6d1.png

InftyReader识别数学公式(布局分析和公式校正)

一些老师、科研人员,希望将书本上的或图片上的数学公式输入到word或者latex中,为提高效率,就需要用到识别公式的OCR软件。

inftyReader是一款由日本人开发的印刷体数学公式识别软件,识别正确率较高,且可以自动分析版面,标出公式区域,批量转换,但不幸的是不支持中文。网络上许多软件应用是单个截屏识别,不能批量转换。inftyReader界面如下图所示。

b814a06f158b8f19e6a824027bd98f24.png
InftyReader软件界面

大部分参数一看就明白了,有一些会比较难理解。

  1. image dpi 图片的分辨率,建议值是400dpi或600dpi,分辨率较小,识别效果会变差。
  2. Search subfolders当选择的是文件夹时,此选项才可选,勾选代表也处理子文件夹内的文件。
  3. Use Layout Information File(LIF) 使用页面布局分析文件LIF
  4. Use Math Area Information in LIF使用LIF文件中的数学公式区域
  5. Math Level数学水平, All Math Symbols所有数学符号,High School Level Math Symbols高中数学符号。选择正常的数学水平有利于提高识别正确率。
  6. Layout Information(LIF) 页面布局分析文件LIF,属于Output File Format的一种,是“Use Layout Information File(LIF)”和“Use Math Area Information in LIF”两个选项用到的文件。
  7. CharacterInformation(CIM) 字符特征信息,应该是用来训练OCR,提高识别正确率的。
  8. Set Newline Code at新行代码设置在哪里,有两个选项“the end of each line”和“the end of each paragraph”,每行的结尾,还是每段的结尾,就是在哪里断行。
  9. Use FineReader Engine使用ABBYY FineReader Engine。和面向普通用户的ABBYY FineReader 15程序是不一样的,ABBYY FineReader Engine是一个面向程序员的开发工具。如果可以使用这个开发工具,那么InftyReader应该就可以支持中文了。

使用InftyReader识别数学公式,可按如下步骤操作,正确率会更高。

第一步 生成页面布局分析文件LIF并修改

在正式识别公式之前,应该先让inftyReader生成一个页面布局分析文件,查看这个文件,纠正页面布局分析的错误。

示例为一个文字版的高清pdf文件,包含大量公式,如下图所示。尽管是文字版的pdf,但导出word文件,公式部分仍是混乱不堪的,所以还是需要OCR识别。

0e1035886d2f78e2a5a0968daa980d4f.png
示例图

选中示例pdf文件,选择输出文件格式为layout information(LIF),单击Start OCR,即可在pdf源文件夹下生成与pdf文件同名的以.lif为后缀的文件。因为设置了open result file by the application,所以此时,layoutviewer程序自动弹出,在此界面可以对标记公式区域进行修改。layoutviewer是在安装inftyReader时附带安装的。操作如下视频所示。

知乎视频​www.zhihu.com

第二步 识别公式输出到iml,对识别错误的公式进行修改

iml格式文件,供InftyEditor使用。inftypeditor是在InftyProject下开发的数学公式编辑软件,是免费使用的,需要另外下载安装。采用IML的优点是打开识别结果时,会同时打开原始图像文件,单击某个输出结果,会自动跳转到图像的相应位置,以便对照修改。IML文件可以通过InftyEditor转换为LaTex、HTML、MathML、PDF、PS或Word2007。

勾选use math area information in lif,输出文件格式iml,单击Start OCR,就可以得到与源pdf文件同名的以.iml为后缀的文件。因为设置了open result file by the application,所以此时,inftypeditor程序会自动弹出,在界面下可以对输出的公式结果进行修改。

在InftyEditor中,公式显示为蓝色,文本显示为黑色,但最终输出的时候都会是黑色。在修改公式之前,需要启用数学公式模式。在输入数学符号、函数、分式、根式等时,可以使用类似于latex命令的方式,先输入一个斜杠,然后输入对应的命令,也可以使用右键快捷菜单输入。操作如下视频所示。

知乎视频​www.zhihu.com

第三步 导出到word

修改好的文档就可以导出到word或者其他格式了,操作如下图所示。

a5f11bada0b674cb0f4f948f19ede81f.png
InftyEditor将识别结果导出为word

20d82c17feefc071be0e3ff7f463b5d2.png
InftyReader公式识别效果
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值