论文阅读：LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling

最新推荐文章于 2022-02-15 13:32:28 发布

旋涡小林

最新推荐文章于 2022-02-15 13:32:28 发布

阅读量956

点赞数

分类专栏：语义分割文献笔记文章标签：深度学习计算机视觉卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gyyu32g/article/details/104449260

版权

本文介绍了一种名为LSTM-CF的网络结构，用于RGB-D图像的语义分割任务。通过结合CNN和RNN，特别是利用LSTM来整合上下文信息，该网络在SUNRGBD和NYUDv2数据集上取得了最佳效果。LSTM-CF分别处理RGB和深度图像，然后通过BRNN进行特征融合，有效地替代了池化层的角色。

摘要由CSDN通过智能技术生成

文章目录

1 摘要

（如果之前没有了解过RNN处理语义分割任务时，建议先看这篇文章：论文笔记：ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks，因为这篇文章也是参考了ReNet的思路。）

本文提出一个新颖的网络结构LSTM-CF用于RGB-D图像（有关RGB-D图像的资料戳这！）的分割，该网络同时使用CNN处理RGB-D的RGB图像和深度图像，再将二者进行特征融合使用RNN处理，达到一个对RGB-D图像的分割。由于引入了RNN整合上下文信息，在SUNRGBD数据集和NYUDv2数据集得到当时最好的效果。

2 亮点

2.1 LSTM-CF网络总体思路

LSTM-CF网络的总体思路其实很简单，就是将RGB-D图像分别进行两部分处理，如下图：
在这里插入图片描述
第一部分，通过CNN对RGB图进行特征提取，然后再通过双向RNN（BRNN）对图像每一列进行扫描整合上下文信息；第二部分，对深度图像使用CNN特征提取再通过BRNN每一列进

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling

文章目录1 摘要2 亮点2.1 LSTM-CF网络总体思路2.2 LSTM-CF网络总体结构3 部分效果3.1 LSTM-CF网络各模块的影响3.2 分割效果4 结论5 参考资料1 摘要（如果之前没有了解过RNN处理语义分割任务时，建议先看这篇文章：论文笔记：ReNet: A Recurrent Neural Network Based Alternative to Convolutional...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。