他来了，他来了，Mathpix拜拜了~~~文字、表格、公式图片识别神器V0.1测试版

最新推荐文章于 2024-06-23 14:57:13 发布

civilpy

最新推荐文章于 2024-06-23 14:57:13 发布

阅读量1.8k

点赞数 2

分类专栏： 06_小程序制作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_22713341/article/details/105389706

版权

06_小程序制作专栏收录该内容

4 篇文章 0 订阅

订阅专栏

（图0）

img2txt V0.8 【正式版】

第1步：win10自带截图快捷键：Win+Shift+S，也可以用QQ等截图工具；

第2步：打开软件，完成初始配置（后续调用无需再配置），按需识别：

（1）百度文字识别快捷键：Ctrl+b

（2）百度表格识别快捷键：Ctrl+n

（3）百度图转文字+，批量识别imgs文件夹中的图片

（4）高级公式识别+快捷键：Ctrl+m，需输入随机码，不限次数。

（5）新增：学而思文字识别

（6）新增：学而思表格识别

（7）新增：学而思公式识别

下载地址

链接:
https://pan.baidu.com/s/1DOVudpG4N9ZW8UlVPgPmyQ
提取码: rx86

效果展示

（图1）

（图2）

百度接口

1.在百度智能云https://console.bce.baidu.com/ai/?_=1586327890123&fromai=1#/ai/ocr/app/create，免费创建应用（上图1，随便起名字、描述应用）；每个应用对应着一组：AppID、APIKey、SecretKey（上图2，复制这3个参数），在顶图0工具>配置中填写相应3个参数，保存。

2.识别结果自动弹窗显示，可以选中复制，永久保存在本地result文件夹中，其中：文字识别直接为文字，表格识别为xls的下载链接、公式识别为LaTeX文本。LaTeX文本可以在https://latex.vimsky.com/转换为图片，新版Word及WPS支持直接插入LaTeX文本。

3.辅助工具PDF2IMGS，可以先将PDF文件转为图片，然后将图片拷贝至imgs文件夹，点击图转文字+进行批量识别，单次图片数量不宜过多。

4.辅助工具从曲线（折线）图获取原始数据，科研工作必备辅助工具，4件套打包。

链接:
https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA
提取码: 6pp2

5.百度通用文字识别：50000次/天免费；表格文字识别：50次/天免费；公式识别：0次。百度公式识别准确率比较低，接口已暂时停止开放，后续开放我们再进行版本更新。

（图3）

（图4）

学而思接口

1.学而思的AI产品名字比较酷：好未来AI开放平台：https://ai.100tal.com/。注册相对百度简单，创建应用的方式基本上同百度（图3），创建之后，你会获取到该应用的Access Key ID、Access Key Secret。

2.我们主要用到图像文字OCR接口，将印刷OCR、公式OCR、表格OCR接入（分配）到你已经创建的应用。

3.学而思单个接口日调用次数上限(次)均为100次。配合百度的API，日常文档处理基本上够了。

【注】本工具可以提高日常工作效率。如果你的识别需求量比较大，可以多申请几个账号，目前他们对个人注册账号数量尚均无限制。遇到任何问题，可以联系小编。

【注】本工具适于win7以上64位台式电脑或笔记本；XP、Linux等就不用下载了~

好用帮推荐

他来了，他来了，Mathpix拜拜了~~~

文字、表格、公式图片识别神器V0.1测试版

俺不是标题党！！！

开发背景

日常工作中经常遇到大量的图片版文本、表格、公式需要编辑；

用手敲？也太OUT了吧，好歹咱也是个Python全栈。

2018年就开始比较各大厂的文字识别API，

BAT+H，4家的文字识别相差无几，

表格识别，百度遥遥领先，如果给百度90分，其他3家是不及格的。

很长一段时间，没有找到能够替代Mathpix这个歪果产品，

从github找到tensorflow的源代码，可惜功力不够，无法逆向。

这不，本已放弃了自己搞公式识别，

采用InftyReader.exe这个日本软件配合美帝的Mathpix，

勉强可以免费识别日常的工作量。

2020年4月，无意中发现百度终于开放了公式识别的API，

也不知道和我去年在百度的留言是否有关（当时鄙视了一下大厂的AI技术不接地气）。

开发过程

2020年之前一直在用百度的文字识别API，

当然，只是在Jupyter中仅供自己使用，

也曾想过做成微信小程序，但看着微信小程序中琳琅满目的同型产品，

还是果断的放弃了！

如今百度公式识别的API出来了，竟让我又燃起做一个小工具的想法，

拿起键盘就是个干！

哼哧，哼哧的撸了200来行代码，测试了十来次，大体可行：

好久不用tkinter做win桌面应用，还是遇到了不少BUG，

不过，相较于后面打包遇到的BUG，前端UI都不是个事，

具体体现在：

1.conda这个奇葩虽然生猛，但是用Pyinstaller打包，一个小小的工具，竟然300M。

2.重新安装一个版本的Python，新建虚拟环境，结果约到pip不能升级的问题。

3.再次打包，遇到Pyinstaller打包报错Failed to execute script pyi_rth_pkgres。

4.都懒得改应用的图标了，测试版就先这样吧。毕竟它实现了既定的3个识别功能。

下载链接：

链接: https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA

提取码: 6pp2

BUG参考文档：

解决Python 3.6使用pip时Unable to locate finder for pip._vendor.distlib的问题

Pyinstaller打包报错Failed to execute script pyi_rth_pkgres

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

civilpy CSDN认证博客专家 CSDN认证企业博客

码龄10年

452: 原创

2万+: 周排名

4285: 总排名

39万+: 访问

: 等级

8097: 积分

2839: 粉丝

2985: 获赞

27: 评论

3131: 收藏

私信

关注

热门文章

分类专栏

最新评论

【注册岩土】Python土力学与基础工程计算.PDF-摩尔-库伦强度理论
人工智能前沿技术，: 您好请问可以聘请您讲授深度学习在岩土力学专题课程吗？课酬可以详谈
【注册岩土】Python土力学与基础工程计算.PDF-土中的应力
刘先生lll: 您好请问可以聘请您讲授深度学习在岩土工程中的应用与实践专题课程吗？课酬可以详谈
【Python】如何使用pip列出所有可用的Python包版本？
阿J~: 强呀强呀，好文支持!
如何在Python中检查NaN值？
wang151038606: “使用专门的函数：始终使用math.isnan()或NumPy的np.isnan()来检测NaN值。”。找到好用的方法
【Python】探索Python中的目录遍历：获取当前目录下所有子目录列表
说文科技: 写了一个递归代码用于获取指定目录下的所有txt文件： [code=python] # 引入系统模块 import os def get_all_txt_in_path(path): """ 功能：获取指定路径下的所有txt文件，以list的形式返回参数：文件路径path """ # 如果是一个文件夹，那么需要找到路径下的所有子文件 if os.path.isdir(path): cur_res = [] entries = os.listdir(path) # 遍历其中的每一项 for entry in entries: cur_path = os.path.join(path,entry) if os.path.isdir(cur_path): # 如果是一个dir cur_res.extend(get_all_txt_in_path(cur_path)) elif cur_path.endswith(".txt"): cur_path.append(cur_path) return cur_res # 如果当前文件就是.txt文件 elif path.endswith(".txt"): return [path] return [] [/code]

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。