python提取excel数据形成表格_腾讯云文字识别API提取表格数据并生成Excel文件

本文主要介绍了利用腾讯云表格文字识别API提取图片表格数据并生成Excel文件。主要涉及的知识点有:腾讯云API的调用、json文件的处理以及Excel文件的生成。

背景

在工作中,各种电子文件和纸质文件满天飞,穿梭于各个用户终端之间。有时,我们需要将纸质版数据电子化,往往需要耗费大量的人力,从而增加工作负担。一种被称为OCR的技术的发明,在一定程度上解决了这个问题。文字识别技术已经发展的十分成熟,我们熟知的软件,如QQ等,都可以进行文字识别。但是支持结构化的表格文字识别的工具不多,即使有,大多数也是收费的——目前我们还没有养成付费使用的习惯。

鉴于上述情况,本文利用腾讯云提供的表格文字提取API,结合python,实现了表格文字批量提取的功能,避免了手动录入的尴尬,减轻了工作负担。

使用工具及python包介绍

腾讯API

国内大型互联网公司都提供云服务,如阿里、百度、腾讯等。本文选择腾讯云服务,是因为提供的API说明比较详细,看一遍就能用。更良心的是,提供了在线测试的功能,基本不用写代码也能够测试效果。

Python包

pandas 数据分析必备包,用来对二维表数据进行分析整合。

os 更改系统配置信息,如列出工作目录的文件,更改工作目录等。

json 用来处理json数据,或者把字符串等其他格式的数据转化为json数据。

base64 用来对图片进行base64编码,这是根据API的要求做的。

xlwings 用来与Excel进行交互,几乎可以取代VBA,容易学习。

<
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值