如何快速将几十张纸质材料转换成电子文档

工作中经常会有将大量纸质材料转换电子文档的需要,今天就介绍一个快速转换的方法。

思路:

首先需要将材料用手机拍成照片,按照阿拉伯数字从1开始命名,然后写个程序可以识别图片的工具就可以了。今天就借用百度云的文字识别API实现这个功能:

# encoding:utf-8
import requests
import base64
def get_access_token():
    AK='NEqHQFs0oBcxAdkZXRnHGQPp' # client_id 为官网获取的AK
    SK='BrUGOa1Htz364UOdkHLGS7KxbA5G6Kkc'# client_secret 为官网获取的SK
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s'%(AK,SK)
    response = requests.get(host)
    access_token = response.json()['access_token']
    return  access_token

#imag_num 图片张数
def image_analysis(imag_num):
    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic" #调用api接口
    for i in range(1,int(imag_num)+1):
        f = open(str(i)+'.jpg', 'rb') # 二进制方式打开图片文件
        img = base64.b64encode(f.read())
        request_url = request_url + "?access_token=" + get_access_token()
        headers = {'content-type': 'application/x-www-form-urlencoded'}
        response = requests.post(request_url, data={"image":img}, headers=headers)
        if response:
            words_result=response.json()['words_result']
            if words_result:
                result=open('result.txt',mode='a')
                for words in words_result:
                    result.write(words['words']+'\n')
if __name__=='__main__':
    imag_num=input('请输入图片张数(比如 2):')
    print('**************图片正在解析**************')
    image_analysis(imag_num=imag_num)
    input('图片解析完成,已保存到result.txt,按任意键退出:')

备注:代码中使用的AK 和 SK是我申请好的可以直接使用,但如果大量调用还是请自己申请一个吧。
关注微信公众号,可以下载打包EXE程序奥。
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值