表格识别专栏
文章平均质量分 57
本专栏记录表格识别方面的技术,包括论文阅读笔记、开源代码复现、数据集介绍以及下载等。
CV-deeplearning
小米AI Lab图像算法工程师,擅长表格识别、目标检测、行人属性识别、车牌识别等。
展开
-
表格 html2img:把html转化为图片
一. 前景提要提取html中的表格图片,原理如下:开启浏览器找到表格的坐标截屏,得到表格图片二. 代码展示import osimport pyppeteerfrom pyppeteer import launchimport asynciofrom tqdm import tqdmasync def get_jpgs(html_path, img_path): browser = await launch() page = await browser.newPag原创 2022-05-13 17:02:05 · 853 阅读 · 0 评论 -
Table master训练测试流程
一. 环境配置参考:https://github.com/JiaquanYe/TableMASTER-mmocr由于依赖mmdetection,对版本的要求如下:Python:3.6+PyTorch:1.3+CUDA 9.2+GCC 5+在服务器上,在没有sudo权限的情况下配置gccexport PATH=/home/work/guopei/gcc-8.2.0-bin/bin:$PATHexport PATH=/home/work/guopei/gcc-8.2.0-bin/lib64:$原创 2022-04-24 08:49:51 · 2177 阅读 · 11 评论 -
pubtabnet数据清洗
一. 问题描述puttabnet中数据不太干净,特别是坐标的标注,如下图:二. 数据清洗直接看代码"""把pubtabnet数据集中坐标标注错误的数据筛选除去"""import jsonlinesimport osimport cv2def iou(bbox1, bbox2): """ Calculates the intersection-over-union of two bounding boxes. """ bbox1 = [float(x)原创 2022-02-25 17:32:17 · 928 阅读 · 2 评论 -
表格识别综述与相关实战
一. 百度表格识别原理参考我的博客:百度表格识别——原理解读模型训练实战请参考我的博客:基于PP-OCR训练表格识别模型二. 平安科技表格识别原理请参考我的博客:平安科技表格识别——原理解读三. 腾讯表格识别方案解读:https://zhuanlan.zhihu.com/p/69793742网友复现:https://github.com/tommyMessi/tableImageParser_tx四. 好未来表格识别方案解读:https://mp.weixin.qq.com/s/JyA10原创 2021-12-05 12:42:21 · 1069 阅读 · 1 评论 -
基于PP-OCR训练表格识别模型
参考:百度官网一. 配置PP-OCR环境pp-ocr环境配置教程二. 训练数据准备数据下载地址或者用命令下载数据curl -o ./PubTabNet.tar.gz https://dax-cdn.cdn.appdomain.cloud/dax-pubtabnet/2.0.0/pubtabnet.tar.gz下载数据后解压,并用代码将其划分为训练集和验证集,代码如下:import jsonlines"""把PubTabNet_2.0.0.jsonl分成PubTabNet_2.0.0_t原创 2021-12-05 12:17:33 · 4542 阅读 · 13 评论 -
TableBank——表格检测识别数据集
1. 论文:https://arxiv.org/pdf/1903.01949.pdf2. 代码:https://github.com/doc-analysis/TableBank3. 数据:https://doc-analysis.github.io/tablebank-page/index.html4. 数据下载并解压下载的是多个zip文件,如何解压zip分卷:cat TableBank.zip.00* > TableBank.zipunzip TableBank.zip...原创 2021-12-05 11:21:08 · 1377 阅读 · 1 评论 -
PubTabNet——论文阅读笔记
一. 前景介绍论文:https://arxiv.org/pdf/1911.10683.pdf ((Image-based table recognition: data, model, and evaluation))代码:https://github.com/ibm-aur-nlp/PubTabNet (包含数据下载地址)该论文是2020年IBM的表格识别论文,该论文对之后的表格识别工作有很大的影响。二. 论文贡献1. 开源数据集开源了表格识别的数据集,50多万张表格和对应的标注信息, 数据原创 2021-12-05 11:01:52 · 3612 阅读 · 1 评论 -
平安科技表格识别——原理解读
一. 前景介绍代码:https://github.com/JiaquanYe/TableMASTER-mmocr论文:https://arxiv.org/pdf/2105.01848.pdf论文解读:https://blog.csdn.net/devcloud/article/details/120987923平安在ICDAR 2021表格识别比赛中获得亚军,基于MASTER的改进。在平安科技最新发布的表格识别模型TableMaster中,提出了另外一种解决思路,即同时训练得到单元格内的文字块位置和原创 2021-12-02 20:31:50 · 4462 阅读 · 0 评论 -
百度表格识别——原理解读
一. 算法框架表格识别技术主要使用基于注意力机制的图片描述模型 RARE,整体流程如下图所示,对于其中的表格区域进行表格识别处理。表格识别的难点主要在于表格结构的提取,以及将表格信息与 OCR 信息融合。整体流程可以分为上下两部分,其中上半部分(黑色支路)是普通的 OCR 过程,通过(1)文本检测模块对表格图片进行单行文字检测,获得坐标,然后通过(2)文本识别模块识别模型得到文字结果。而在下半部分的在蓝色支路中,表格图片首先经过(3)表格结构预测模块,获得每个 Excel 单元格的四点坐标与表格结构原创 2021-12-02 19:22:20 · 3369 阅读 · 2 评论