表格的检测与识别-可转换为excel-提供预训练模型

文章分享了表格检测与识别的技术,包括表格检测、内容识别和表格线检测。提供了GitHub链接,其中一个项目包含表格线检测转Excel的思路,OCR部分使用了亚马逊API,可替换为其他接口。推荐了一个OCR项目的GitHub链接。
摘要由CSDN通过智能技术生成

表格识别-可转换为excel-提供预训练模型

  1. 不说废话:表格的检测与识别可分为两个大部分:表格的检测与表格的内容识别,表格的检测不多BB,拿个目标检测或者分割模型就行
  2. 表格内容的识别包括两个部分表格线的检测与表格中文本的检测与识别。后者不多BB,你用paddle或者其他任意的ocr算法都行
  3. 这里我也不提供方法,直接给出github地址,方法也不是我想的,但是我写了个很丑的页面:
    很丑的页面
    Github链接:
    https://github.com/whn09/table_structure_recognition/tree/main

这个代码中的表格检测可能你用不到,需要重新训练,但是他的表格线检测成为excel的思路可以借鉴,有好多细节自己去探索把,另外代码的ocr部分是调用的亚马逊的api接口,你可以替换 这里我也推荐一个ocr的github地址
Github链接:
https://github.com/myhub/tr

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值