excel图片地址直接显示图_图片转表格基于百度AI

最新推荐文章于 2024-08-19 11:19:33 发布

糖果木工坊

最新推荐文章于 2024-08-19 11:19:33 发布

阅读量1.1k

点赞数

文章标签： excel图片地址直接显示图

本文链接：https://blog.csdn.net/weixin_35651995/article/details/112087715

版权

失踪日久，皆因进来学业繁重，其实就是没好好学习。偶遇一有趣需求，方才始更一篇。
需求如下：图片内表格，需直接将图片转换为excel表格。

初步构想，迅捷在线转换，奈何没找到直接转换，图片转pdf再转为excel又过于繁琐，结合当下opencv及百度AI的学习更番如下：

首先想到使用opencv库(Laplace算子)进行图像锐化，此处说明由于多数图像为白纸黑字所以锐化是十分有必要的，识别文字边框，进而进行图片中文字识别。但因受限于网络图片清晰度及受限于本身PC的算力等原因造成识别结果差异化严重所以最终放弃。(但是后期会补上代码)此次识别过程结果如下，不理想。

进而开始另求它法，因为最近在学习计算机视觉相关内容，所以各大AI平台的公开接口是绕不开的。本次使用的百度AI大脑开放的ocr接口，识别精度肯定比个人PC的强，毕竟算力的差距在那。插一句，我个人是一直认为百度的技术积累是BAT三家里面最好的，也是最值得期待的。

本次使用的百度开放给公共用户的通用文字识别接口，为求精度本次使用的是高精度版本：https://ai.baidu.com/tech/ocr/general

高精度版本在通用文字识别(标准版)的基础上，提供更高精度的识别服务，支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语)，并将字库从1w+扩展到2w+，能识别所有常用字和大部分生僻字。

开发语言选取python，也是最近一直在学，没办法，学人工智障绕不开的。

在准备开发之前首先确保你已经完成了百度AI平台的注册，申请到了orc识别的接口，一般申请都会过的，万一你没过，反思一下最近是不是在哪捡钱了。

接口请求方式采用post

post和get这两种请求方式各位在面向对象程序设计应该都学过，当然这里不确保你有对象哈！

请求URL：https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic重点圈起来，这个请求的地址是统一的。

然后你需要获取到个人接口的access_token，这里的access_token类似于你微信的ID，确保你调用接口返回参数的唯一性。
百度AI的开发文档给出了多种获取access_token的方式，我最建议的还是内嵌到你的程序中去。

返回参数提供了json/excel两种可选(哈哈哈哈哈哈哈哈，难道百度知道我要转excel)，选择request_type类型为：excel，然后循环写入excel文档。因未能识别框线所以还是需要手动注线，后期笔者努力尽快解决。识别结果：

注：注意开发过程中的个人sessionid和key的正确性，转换结果文档默认保存到了当前工程目录下！

近期会持续更新一些考研相关的注意事项，以及opencv的相关内容和关于ocr识别的案例。
本次工程git链接：https://github.com/sevnxiaolu/PTT.git
感谢star！
最后希望各位最后10天好好复习，上岸成功！

关注