腾讯云文字识别API提取表格数据并生成Excel文件
本文主要介绍了利用腾讯云表格文字识别API提取图片表格数据并生成Excel文件。主要涉及的知识点有:腾讯云API的调用、json文件的处理以及Excel文件的生成。
背景
在工作中,各种电子文件和纸质文件满天飞,穿梭于各个用户终端之间。有时,我们需要将纸质版数据电子化,往往需要耗费大量的人力,从而增加工作负担。一种被称为OCR的技术的发明,在一定程度上解决了这个问题。文字识别技术已经发展的十分成熟,我们熟知的软件,如QQ等,都可以进行文字识别。但是支持结构化的表格文字识别的工具不多,即使有,大多数也是收费的——目前我们还没有养成付费使用的习惯。
鉴于上述情况,本文利用腾讯云提供的表格文字提取API,结合python,实现了表格文字批量提取的功能,避免了手动录入的尴尬,减轻了工作负担。
使用工具及python包介绍
- 腾讯API
国内大型互联网公司都提供云服务,如阿里、百度、腾讯等。本文选择腾讯云服务,是因为提供的API说明比较详细,看一遍