opencv ocr文字识别_用OpenCV和OCR识别图片中的表格数据

本文介绍了如何使用OpenCV识别表格中的线条,以及借助pytesseract识别单元格文字,通过实例展示了从图片中提取表格数据的过程,最终得出约90.6%的识别准确率。
摘要由CSDN通过智能技术生成

13ab0f9a-df15-eb11-8da9-e4434bdf6706.jpeg

作者: jclian,喜欢算法,热爱分享,希望能结交更多志同道合的朋友,一起在学习Python的道路上走得更远!

  在很多时候,我们的数据来源形式是多种多样的,有时候数据(或表格)也会呈现在图片中。那么,我们如何来获取图片中的有用数据呢?当一张图片中含有表格数据的时候,我们可以用OpenCV识别表格中的直线,然后再用OCR技术识别其中的文字。
  本文仅作为如何识别图片中的表格的一个例子,希望能给读者一些启示。笔者用到的工具如下:

  • opencv

  • pyteressact

  • numpy

我们用opencv来识别表格中的直线,用pyteressact来识别单元格文字,用numpy做数值处理。我们要识别的示例图片(AI.png)如下:

15ab0f9a-df15-eb11-8da9-e4434bdf6706.png
示例图片 AI.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值