他来了,他来了,Mathpix拜拜了~~~文字、表格、公式图片识别神器V0.1测试版

 

 

(图0)

img2txt V0.8 【正式版】

第1步:win10自带截图快捷键:Win+Shift+S,也可以用QQ等截图工具;

第2步:打开软件,完成初始配置(后续调用无需再配置),按需识别:

(1)百度文字识别快捷键:Ctrl+b

(2)百度表格识别快捷键:Ctrl+n

(3)百度图转文字+,批量识别imgs文件夹中的图片

(4)高级公式识别+快捷键:Ctrl+m,需输入随机码,不限次数。

(5)新增:学而思文字识别

(6)新增:学而思表格识别

(7)新增:学而思公式识别


下载地址

 

链接:
https://pan.baidu.com/s/1DOVudpG4N9ZW8UlVPgPmyQ
提取码: rx86

效果展示

 

 

 

 

 

 

(图1)

 

 

(图2)

百度接口

1.在百度智能云https://console.bce.baidu.com/ai/?_=1586327890123&fromai=1#/ai/ocr/app/create,免费创建应用(上图1,随便起名字、描述应用);每个应用对应着一组:AppID、APIKey、SecretKey(上图2,复制这3个参数),在顶图0工具>配置中填写相应3个参数,保存。

2.识别结果自动弹窗显示,可以选中复制,永久保存在本地result文件夹中,其中:文字识别直接为文字,表格识别为xls的下载链接、公式识别为LaTeX文本。LaTeX文本可以在https://latex.vimsky.com/转换为图片,新版Word及WPS支持直接插入LaTeX文本。

3.辅助工具PDF2IMGS,可以先将PDF文件转为图片,然后将图片拷贝至imgs文件夹,点击图转文字+进行批量识别,单次图片数量不宜过多。

4.辅助工具从曲线(折线)图获取原始数据,科研工作必备辅助工具,4件套打包。

 

链接:
https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA
提取码: 6pp2

 

5.百度通用文字识别:50000次/天免费;表格文字识别:50次/天免费;公式识别:0次。百度公式识别准确率比较低,接口已暂时停止开放,后续开放我们再进行版本更新。

 

 

(图3)

 

 

(图4)

学而思接口

1.学而思的AI产品名字比较酷:好未来AI开放平台:https://ai.100tal.com/。注册相对百度简单,创建应用的方式基本上同百度(图3),创建之后,你会获取到该应用的Access Key ID、Access Key Secret

2.我们主要用到图像文字OCR接口,将印刷OCR、公式OCR、表格OCR接入(分配)到你已经创建的应用。

3.学而思单个接口日调用次数上限(次)均为100次。配合百度的API,日常文档处理基本上够了。

【注】本工具可以提高日常工作效率。如果你的识别需求量比较大,可以多申请几个账号,目前他们对个人注册账号数量尚均无限制。遇到任何问题,可以联系小编。

【注】本工具适于win7以上64位台式电脑或笔记本;XP、Linux等就不用下载了~

好用帮推荐

 


 

他来了,他来了,Mathpix拜拜了~~~

文字、表格、公式图片识别神器V0.1测试版

俺不是标题党!!!

开发背景

日常工作中经常遇到大量的图片版文本、表格、公式需要编辑;

用手敲?也太OUT了吧,好歹咱也是个Python全栈。

2018年就开始比较各大厂的文字识别API,

BAT+H,4家的文字识别相差无几,

表格识别,百度遥遥领先,如果给百度90分,其他3家是不及格的。

很长一段时间,没有找到能够替代Mathpix这个歪果产品,

从github找到tensorflow的源代码,可惜功力不够,无法逆向。

这不,本已放弃了自己搞公式识别,

采用InftyReader.exe这个日本软件配合美帝的Mathpix,

勉强可以免费识别日常的工作量。

2020年4月,无意中发现百度终于开放了公式识别的API,

也不知道和我去年在百度的留言是否有关(当时鄙视了一下大厂的AI技术不接地气)。

开发过程

2020年之前一直在用百度的文字识别API,

当然,只是在Jupyter中仅供自己使用,

也曾想过做成微信小程序,但看着微信小程序中琳琅满目的同型产品,

还是果断的放弃了!

如今百度公式识别的API出来了,竟让我又燃起做一个小工具的想法,

拿起键盘就是个干!

哼哧,哼哧的撸了200来行代码,测试了十来次,大体可行:

好久不用tkinter做win桌面应用,还是遇到了不少BUG,

不过,相较于后面打包遇到的BUG,前端UI都不是个事,

具体体现在:

1.conda这个奇葩虽然生猛,但是用Pyinstaller打包,一个小小的工具,竟然300M。

2.重新安装一个版本的Python,新建虚拟环境,结果约到pip不能升级的问题。

3.再次打包,遇到Pyinstaller打包报错Failed to execute script pyi_rth_pkgres。

4.都懒得改应用的图标了,测试版就先这样吧。毕竟它实现了既定的3个识别功能。

 

下载链接:

链  接: https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA 

提取码: 6pp2

 

BUG参考文档:

解决Python 3.6使用pip时Unable to locate finder for pip._vendor.distlib的问题​

Pyinstaller打包报错Failed to execute script pyi_rth_pkgres

你可以使用百度AI人脸识别的API来实现这个功能。首先,你需要将返回的人脸信息的人脸位置坐标提取出来,然后使用这些坐标来截取出人脸图片。最后,你可以使用图像处理库(如OpenCV)来显示截取出的人脸图片。 以下是一个示例代码,使用Python和百度AI人脸识别API实现了这个功能: ```python import requests import cv2 import numpy as np # 设置API参数 API_KEY = '你的API_KEY' SECRET_KEY = '你的SECRET_KEY' api_url = 'https://aip.baidubce.com/rest/2.0/face/v3/detect' # 读取图片文件 image_path = 'path_to_image.jpg' image = cv2.imread(image_path) # 调用API进行人脸检测 headers = {'Content-Type': 'application/json'} params = { 'image': cv2.imencode('.jpg', image)[1].tobytes(), 'image_type': 'BASE64', 'face_field': 'location' } response = requests.post(api_url, params=params, headers=headers, auth=(API_KEY, SECRET_KEY)) result = response.json() # 提取人脸位置信息 face_locations = result['result']['face_list'][0]['location'] left = face_locations['left'] top = face_locations['top'] width = face_locations['width'] height = face_locations['height'] # 截取人脸图片 face_image = image[top:top+height, left:left+width] # 显示截取出的人脸图片 cv2.imshow('Face Image', face_image) cv2.waitKey(0) cv2.destroyAllWindows() ``` 在上面的代码,你需要将`API_KEY`和`SECRET_KEY`替换为你自己的百度AI人脸识别的API凭证。同时,你需要将`image_path`替换为你要处理的图片文件的路径。 这段代码会将人脸识别API返回的第一张人脸的位置信息提取出来,并使用OpenCV库来截取出人脸图片并显示出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值