大家好,这里是程序员晚枫,全网都叫这个名~
上次给大家分享了:《1行Python代码,实现增值税发票识别》。(PS:百度一下这个书名号里的标题,就可以看见对应的视频教程哟~)
在那个视频的开始,也预告了本篇的内容:把识别的发票内容,分门别类的写进Excel文件里。
今天我们就来一起看一下吧!
1、先上代码
识别发票并且写入AI功能,调用了python的第三方库:poocr。
直接上代码,看到这里,提醒一下还没有安装Python的同学,可以看一下我主页的全套免费教程,跟着我免费下载和安装一下Python。
# 安装这个库
pip install poocr
(左右滑动,查看全部)
# 运行这个库
import poocr
# 1行代码,完成识别发票 + 导入Excel
poocr.ocr2excel.VatInvoiceOCR2Excel(intput_path=r'C:\程序员晚枫的文件夹\增值税发票-test.jpg',
output_excel='程序员晚枫的发票信息.xlsx',
configPath=r'D:\程序员晚枫的配置文件夹\py310\potencent-test\poocr-config.toml'
)
运行结果如下:
2、代码说明
poocr
是一个具有ocr功能的python第三方库,支持识别100多种场景下的文字识别,例如:发票、驾驶证、身份证等。
底层实现应用的是腾讯提供的AI功能,其中configPath
需要配置一下腾讯AI的id和key,如下面的代码所示。(左右滑动,查看全部)
# 文件名:poocr-config.toml
[tencent-ai]
TENCENTCLOUD_SECRET_ID = 'AKIDX7d3CFCBlLtxIdxGWls8RmAsUCrBoP6p' # 获取可参考 https://cloud.tencent.com/act/cps/redirect?redirect=36394&cps_key=ca76be5a2293ba3906d6d5407aea15ee
TENCENTCLOUD_SECRET_KEY = 'EUlBfBd9HPTRYfgdVPOKG7yjO2gQwgEp' # 获取可参考 https://cloud.tencent.com/act/cps/redirect?redirect=36394&cps_key=ca76be5a2293ba3906d6d5407aea15ee