excel图片地址直接显示图_图片转表格基于百度AI

   失踪日久,皆因进来学业繁重,其实就是没好好学习01e25932cc357e6e2212a89c991209ec.png。偶遇一有趣需求,方才始更一篇。
    需求如下:图片内表格,需直接将图片转换为excel表格。

44a9dd9f57cb70885e9fc07a43df5c3b.png

    初步构想,迅捷在线转换,奈何没找到直接转换,图片转pdf再转为excel又过于繁琐,结合当下opencv及百度AI的学习更番如下:

    首先想到使用opencv库(Laplace算子)进行图像锐化,此处说明由于多数图像为白纸黑字所以锐化是十分有必要的,识别文字边框,进而进行图片中文字识别。但因受限于网络图片清晰度及受限于本身PC的算力等原因造成识别结果差异化严重所以最终放弃。(但是后期会补上代码)此次识别过程结果如下,不理想。

8089e76aefb81be6164e03ec4a737adf.pnge8958027893fd15301fabd22f066ca11.png

    进而开始另求它法,因为最近在学习计算机视觉相关内容,所以各大AI平台的公开接口是绕不开的。本次使用的百度AI大脑开放的ocr接口,识别精度肯定比个人PC的强,毕竟算力的差距在那。插一句,我个人是一直认为百度的技术积累是BAT三家里面最好的,也是最值得期待的。

    本次使用的百度开放给公共用户的通用文字识别接口,为求精度本次使用的是高精度版本:https://ai.baidu.com/tech/ocr/general

809a96a951aa177d4791c8b5f5d81188.png

    高精度版本在通用文字识别(标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。

    开发语言选取python,也是最近一直在学,没办法,学人工智障绕不开的。

在准备开发之前首先确保你已经完成了百度AI平台的注册,申请到了orc识别的接口,一般申请都会过的,万一你没过,反思一下最近是不是在哪捡钱了4ac9258e4c9f251ad10f3ac9d8c499d3.png

    接口请求方式采用post

    post和get这两种请求方式各位在面向对象程序设计应该都学过,当然这里不确保你有对象哈!

    请求URL:https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic重点圈起来,这个请求的地址是统一的。

    然后你需要获取到个人接口的access_token,这里的access_token类似于你微信的ID,确保你调用接口返回参数的唯一性。
百度AI的开发文档给出了多种获取access_token的方式,我最建议的还是内嵌到你的程序中去。

    返回参数提供了json/excel两种可选(哈哈哈哈哈哈哈哈,难道百度知道我要转excel),选择request_type类型为:excel,然后循环写入excel文档。因未能识别框线所以还是需要手动注线,后期笔者努力尽快解决。识别结果:

a82a8d5e8aa205cc72114b45c5a6d614.png

注:注意开发过程中的个人sessionid和key的正确性,转换结果文档默认保存到了当前工程目录下!

近期会持续更新一些考研相关的注意事项,以及opencv的相关内容和关于ocr识别的案例。
本次工程git链接:https://github.com/sevnxiaolu/PTT.git
感谢star!
最后希望各位最后10天好好复习,上岸成功!

c561c6f29d4bb0e8bf181cb92096c28b.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值