基于墙体边缘识别的快速低成本重建策略

最新推荐文章于 2024-09-04 10:31:20 发布

吃橘子的猴子

最新推荐文章于 2024-09-04 10:31:20 发布

阅读量3.6k

点赞数

文章标签： python 深度学习计算机视觉

本文链接：https://blog.csdn.net/Decayboy/article/details/124150020

版权

本文探讨了室内布局识别，尤其是基于RGB全景图的墙体边缘识别技术，用于快速低成本重建室内3D模型。关键点包括全景图获取、语义分割、DulaNet和HorizonNet等网络模型在室内识别中的应用，以及当前面临的问题如遮挡和数据集限制。提出了一种结合梯度边缘与EfficientNet的识别方法，以提高识别准确性和速度。未来研究将关注实时重建和室内定位技术。

摘要由CSDN通过智能技术生成

基于墙体边缘识别的快速低成本重建策略

背景简介

写在前面，关键词：室内布局识别（layout estimation 国外论文翻译过来，但这里重在研究室内整体布局识别，即墙体边缘识别）
定义：室内布局识别任务是通过分析一张RGB图像，来估计图像内的墙体边缘，经过后处理得到室内空间的粗略3D户型模型，如下图。
应用场景：在物联网家居中，一般需要房屋的户型图来控制所有联网设备的运转，为此可以通过我们的策略快速重建户型图。还可用于虚拟装修设计、机器人低成本避障、二手房交易快速重建户型图等，实现它的应用价值。
在这里插入图片描述

RGB全景图

1.全景图是以相机为中心对周围环境360°的视角图像。
2.全景图可以通过专业的全景相机获得，也可以通过手机拍照拼接而成。
3. 研究对象的是不带景深的全景图房间布局识别，并估计出每面墙的景深，下图左边是一张RGB全景图，右边是经过我们的算法处理后的景深图像。

关键技术：全景图语义分割

1.在图像识别中，图像语义分割是指对图像中的像素点进行分类，而分类结果的边界即为图像中不同事物的边界。
2.在全景图的语义分割中，全景图的标签（标注结果，分类的话就是类别名或序号）是一个图像语义边界点的集合。

基于墙体边缘识别的快速低成本重建策略

基础框架

快速重建室内户型策略步骤：
1.从手机拍取图像进行拼接
2.全景图数据集采集与标注（用于训练网络模型）
3.快速的室内墙体边缘识别方法
4.根据墙体边缘线翻折得到3D盒子（室内物体识别及渲染）
在这里插入图片描述

室内墙体边缘识别技术路线

结合梯度边缘与EfficientNet的室内布局识别方法，拥有快速且更高的识别准确度，网络模型结构如下所示。尽管使用残差网络 (residual network,ResNet)作为图像识别的编码网络取得了巨大的成功. 但残差网络只解决了随着网络深度增加所带来的弊端, 经验表明, 网络精度的提升重点在于网络深度、网络宽度、分辨率这三个维度。而进行梯度边缘预提取则简化了图像的局部纹理特征，让模型更专注识别墙体的边缘，并且在模型识别流程中，我们将水平与垂直边缘区分开来识别，实现1x1024+2x1024的墙体边缘线表示（HorizonNet是3x1024表示），最后，该方法识别准确率及速度在私有数据集上最好。
在这里插入图片描述

室内家具识别快速重建场景

说到家具识别是不是最先想到yolo v5快速识别家具呢。其实这样并不能很好的重建室内场景，因为它并不能识别物体相对于整体布局的3D位置级物体的旋转特性。为此再使用yolo v5的同时还需要辨别物体的状态特征.重建场景如下图所示。这里附上一篇牛皮的综述，State-of-the-art in Automatic 3D Reconstruction of Structured Indoor Environments。它讲述了室内3D重建近几年的研究成果，感兴趣的小伙伴可以细品。
在这里插入图片描述

未来研究

对于单个室内空间的重建如上述所示，要想得到一个比较完整的粗略户型图，则还需要在手机拍照的拼接的同时进行室内定位。如下图所示在A地点拍完后需要跟踪手机的位置，然后用户到B点进行拍摄，在重建出单个空间场景后，区分每个室内空间的内墙与外墙，并有序的连接在一起。目前有一些APP能够完成重建，例如，如视VR，CubiCasa等新兴的应用，还感兴趣的小伙伴自己探索吧，谢谢阅读!
在这里插入图片描述