
InftyReader识别数学公式(布局分析和公式校正)
一些老师、科研人员,希望将书本上的或图片上的数学公式输入到word或者latex中,为提高效率,就需要用到识别公式的OCR软件。
inftyReader是一款由日本人开发的印刷体数学公式识别软件,识别正确率较高,且可以自动分析版面,标出公式区域,批量转换,但不幸的是不支持中文。网络上许多软件应用是单个截屏识别,不能批量转换。inftyReader界面如下图所示。

大部分参数一看就明白了,有一些会比较难理解。
- image dpi 图片的分辨率,建议值是400dpi或600dpi,分辨率较小,识别效果会变差。
- Search subfolders当选择的是文件夹时,此选项才可选,勾选代表也处理子文件夹内的文件。
- Use Layout Information File(LIF) 使用页面布局分析文件LIF
- Use Math Area Information in LIF使用LIF文件中的数学公式区域
- Math Level数学水平, All Math Symbols所有数学符号,High School Level Math Symbols高中数学符号。选择正常的数学水平有利于提高识别正确率。
- Layout Information(LIF) 页面布局分析文件LIF,属于Output File Format的一种,是“Use Layout Information File(LIF)”和“Use Math Area Information in LIF”两个选项用到的文件。
- CharacterInformation(CIM) 字符特征信息,应该是用来训练OCR,提高识别正确率的。
- Set Newline Code at新行代码设置在哪里,有两个选项“the end of each line”和“the end of each paragraph”,每行的结尾,还是每段的结尾,就是在哪里断行。
- Use FineReader Engine使用ABBYY FineReader Engine。和面向普通用户的ABBYY FineReader 15程序是不一样的,ABBYY FineReader Engine是一个面向程序员的开发工具。如果可以使用这个开发工具,那么InftyReader应该就可以支持中文了。
使用InftyReader识别数学公式,可按如下步骤操作,正确率会更高。
第一步 生成页面布局分析文件LIF并修改
在正式识别公式之前,应该先让inftyReader生成一个页面布局分析文件,查看这个文件,纠正页面布局分析的错误。
示例为一个文字版的高清pdf文件,包含大量公式,如下图所示。尽管是文字版的pdf,但导出word文件,公式部分仍是混乱不堪的,所以还是需要OCR识别。

选中示例pdf文件,选择输出文件格式为layout information(LIF),单击Start OCR,即可在pdf源文件夹下生成与pdf文件同名的以.lif为后缀的文件。因为设置了open result file by the application,所以此时,layoutviewer程序自动弹出,在此界面可以对标记公式区域进行修改。layoutviewer是在安装inftyReader时附带安装的。操作如下视频所示。
知乎视频www.zhihu.com第二步 识别公式输出到iml,对识别错误的公式进行修改
iml格式文件,供InftyEditor使用。inftypeditor是在InftyProject下开发的数学公式编辑软件,是免费使用的,需要另外下载安装。采用IML的优点是打开识别结果时,会同时打开原始图像文件,单击某个输出结果,会自动跳转到图像的相应位置,以便对照修改。IML文件可以通过InftyEditor转换为LaTex、HTML、MathML、PDF、PS或Word2007。
勾选use math area information in lif,输出文件格式iml,单击Start OCR,就可以得到与源pdf文件同名的以.iml为后缀的文件。因为设置了open result file by the application,所以此时,inftypeditor程序会自动弹出,在界面下可以对输出的公式结果进行修改。
在InftyEditor中,公式显示为蓝色,文本显示为黑色,但最终输出的时候都会是黑色。在修改公式之前,需要启用数学公式模式。在输入数学符号、函数、分式、根式等时,可以使用类似于latex命令的方式,先输入一个斜杠,然后输入对应的命令,也可以使用右键快捷菜单输入。操作如下视频所示。
知乎视频www.zhihu.com第三步 导出到word
修改好的文档就可以导出到word或者其他格式了,操作如下图所示。

