引言
最近身边有朋友进行CAD图纸中标准件的统计工作,感觉甚是麻烦。一方面CAD中的明细表无法直接转换为Excel文件,使用传图识字,迅捷等工具仍感觉不太方便。另一方面,Excel统计也不是很懂。趁着周日,我就写了段代码希望能够帮助到有同样需要的童鞋。后续的Excel统计抽空我在贴出来。。。
代码思路
通过手机拍照或者直接桌面截图的方式获取图纸明细表的照片,然后通过百度AI的OCR识别功能帮助我们将图片转换为Excel文件。
注意事项
需要注册百度AI账号和创建应用,因为代码中需要使用应用的key来获取token。
直接上代码
# encoding:utf-8
import requests
import base64
import time
import os
'''
程序功能:实现CAD图纸明细表图片批量转换为Excel格式
实现方法:利用百度AI提供的表格文本识别接口进行识别
参 数:1 需要注册百度账号并建立应用,使用应用本身的API Key 和 Secre Key
2 提供需要识别的明细表图片名称
返回结果:直接下载Excel到目标文件夹。
时 间:2020.03.29
'''
# 发送OCR识别请求,获取request_id
def send_request(file_name):
request_url = "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request"
# 打开图片文件
f = open(file_name, 'r