海康威视OCR/表格识别开源

9c252b73bb7b113fda57a01b084b096a.gif

向AI转型的程序员都关注了这个号👇👇👇

机器学习AI算法工程   公众号:datayx

5259f4b0dbd5625ae481d62dc843c685.png

论文地址

LGPMA: Complicated Table Structure Recognition with Local and Global Pyramid Mask Alignment (ICDAR 2021).

https://arxiv.org/pdf/2105.06224.pdf

项目代码,模型,数据集 获取方式:

关注微信公众号 datayx  然后回复 表格识别 即可获取。

表格本身是按照人设定的规则来展示数据,具有很强的对齐特性,如果能够得到对齐很好的表格单元格的边框,那么还原表格的结构就非常容易了,因此重点就是如何获得更好的对齐的单元格边框。

LGPMA采用HRNet-W48 Cascade Mask RCNN作为backbone,图像经过CNN提取特征后分成两路,一路类似于Mask RCNN的形式用来检测非空单元格叫LPMA(因为是单元格粒度,所以是局部的),LPMA中又分为3个头,一个头是将单元格中的文本区域分割出来,另外两个头用来学习单元格的水平对齐和垂直对齐的soft mask;另一路叫GPMA(因为是整张图的粒度,所以是全局的),也分为3个头,一个头用来学习整图的二分类mask(单元格区域和非单元格区域),另两个头在全局学习整张图上的非空单元格的水平和垂直对齐的soft mask。在得到两路soft mask后,用一个mask re-scoring的方式将LPMA和GPMA的对齐mask融合,之后对每个单元格边框进行进一步精修。

接下来是对单元格的后处理得到表格结构的过程。分为cell matching,empty cell searching和empty cell merging三个步骤得到最终的表格结构。

03ceb4d3b46034826149b5b87e53ad7d.png

b048f9cd570d390090a21a4c7053b9ee.png

提供了一个在PubTabNet数据集上训练的模型。

11c862049b329f7a65e78f90e7081027.png

表格识别效果

86f8aeb904870c0a5ff13ccb1570f98a.png

4e93e13b3767b8bf1f8fbac33bbaf6ad.png

fa65ca6130720e4186e22fee6143c4f9.png

机器学习算法AI大数据技术

 搜索公众号添加: datanlp

a702e8654bc75f35229f51d2c037e3c0.png

长按图片,识别二维码


阅读过本文的人还看了以下文章:

TensorFlow 2.0深度学习案例实战

基于40万表格数据集TableBank,用MaskRCNN做表格检测

《基于深度学习的自然语言处理》中/英PDF

Deep Learning 中文版初版-周志华团队

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

《深度学习:基于Keras的Python实践》PDF和代码

特征提取与图像处理(第二版).pdf

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

3e6bbb12fe324925405e63489e588f4c.png

### 回答1: 海康威视是一家专业从事视频监控设备和解决方案的供应商。在应用开发方面,它提供了多种接口和技术来帮助实现与其设备的集成。 B/S是浏览器/服务器的缩写,它是一种基于Web的应用架构模式。Java是一种常用的编程语言,具有广泛的应用和强大的跨平台性能。OATP是一种海康威视特定的接口,用于与其设备进行通信和数据交换。 要将海康威视的设备集成到B/S架构的Java应用程序中,需要使用海康威视提供的Java接口和OATP协议进行交互。 首先,需要在Java代码中引入海康威视的开发工具包,该工具包包含了与设备通信所需的类和方法。 其次,需要在应用程序中使用OATP协议与设备进行通信。OATP协议定义了设备的交互规范,包括设备的命令和响应格式等。通过OATP协议,应用程序可以向设备发送指令,并接收设备的响应。 然后,需要编写相应的Java代码来实现设备的连接和控制。在应用程序中,可以创建一个与设备通信的对象,并使用该对象调用相应的方法来实现设备的控制,如获取视频流、控制云台等。 最后,通过编译和部署应用程序,可以在浏览器中访问和使用集成了海康威视设备的功能。 总结来说,通过海康威视的B/S Java接入OATP,我们可以在Java应用程序中实现与海康威视设备的集成和控制。这种集成方式使得用户可以通过浏览器来访问和操作设备,方便实用。 ### 回答2: 海康威视是中国领先的视频监控产品和解决方案供应商。而B/S是指Browser/Server架构模式,即浏览器/服务器模式,而java是一种广泛使用的编程语言。 海康威视的产品中包含了视频监控系统,为了更好地扩展和集成其系统,他们提供了开放应用程序接口(OATP),这样其他开发者可以根据自己的需求进行定制化开发。同时,为了方便开发者进行开发和集成,他们提供了Java接口,这意味着可以使用Java编程语言进行开发、集成和扩展。 通过B/S架构,用户可以通过浏览器来访问海康威视的监控系统,并进行远程监控和管理。Java接入OATP的过程可以简单描述为以下几个步骤: 首先,开发者需要使用Java编程语言来编写代码,实现与海康威视OATP接口的交互。这通常需要使用到一些Java开发工具和框架,如Eclipse等,来简化开发过程。 其次,开发者需要通过调用适当的接口方法,将数据从海康威视的监控系统中获取出来。这可能涉及到视频流的传输、设备的控制等操作。 然后,开发者需要对接收到的数据进行处理和解析。这可以包括对视频流的解码和播放、对设备状态的监控和控制等。 最后,开发者可以将处理后的数据进行展示,以满足用户的需求。这可以通过生成相关的报表、图表等方式完成。 总而言之,海康威视B/S架构Java接入OATP包含了使用Java编程语言开发、集成和扩展海康威视监控系统的过程,使得用户可以通过浏览器进行远程监控和管理。这样的接入方式可以提供更好的灵活性和可定制性,满足不同用户的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值