小白从0读论文之视频语义分割---------------Semantic Video Segmentation by Gated Recurrent Flow Propagation

KJammyHenry

于 2023-12-13 20:29:53 发布

阅读量195

点赞数 3

分类专栏：视频语义分割文章标签：音视频算法计算机视觉卷积神经网络机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/KJammyHenry/article/details/134981193

版权

视频语义分割专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Semantic Video Segmentation by Gated Recurrent Flow Propagation

Abstract

作者提出了一种深度的端到端可训练的视频分割方法，除了稀疏标记的帧之外，该方法还能利用未标记数据中存在的信息，以改进语义估计。该模型结合了卷积架构和时空变换循环层，该层能通过光流在时间上传播标记信息，并基于其局部估计的不确定性进行自适应门控。

Introduction

作者围绕在视频中计算准确且时间一致的语义分割的系统是场景理解的核心这一重点，讲述了现有模型的一些缺陷，而作者采用一种明确的建模方法，依靠现有的单帧cnn增强空间变压器结构，实现沿光流场的扭曲。同时结合自适应循环单元来学习未来单个帧的估计与从附近帧临时传播的标记信息融合在一起，并根据其不确定性进行适当门控。

Related Work

作者回顾了早期语义分割的相关文献，从早期基于时间扩展的方法到归一化分割、随机场模型和跟踪、运动分割或高效的基于分层图的公式等等。

Methodology

作者从前一个时间步ht-1的语义分割开始，通过计算wt=&t-1,t(ht-1)将其沿光流弯曲，使其与时刻t的分割对齐，其中&是沿光流的标签映射。这被作为隐藏状态送到一个门控循环单元，其中另一个输入是由单帧CNN计算的用于语义分割的估计xt.

图1 STGRU结构图

因此模型的主要组成部分：时空变压器扭曲和门控循环单元。

Experiments

作者将自己的方法与其他语义分割方法进行比较，所使用的是具有挑战性的cityscape和CamVid数据集。

Conclusions

作者的模型可以成功地将信息从标记的视频帧传播到附近未标记的视频帧，从而提高语义视频分割的准确性和时间标记的一致性，而不需要额外的注释成本，并且需要很少的补充计算。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
小白从0读论文之视频语义分割---------------Semantic Video Segmentation by Gated Recurrent Flow Propagation

作者围绕在视频中计算准确且时间一致的语义分割的系统是场景理解的核心这一重点，讲述了现有模型的一些缺陷，而作者采用一种明确的建模方法，依靠现有的单帧cnn增强空间变压器结构，实现沿光流场的扭曲。同时结合自适应循环单元来学习未来单个帧的估计与从附近帧临时传播的标记信息融合在一起，并根据其不确定性进行适当门控。
复制链接

扫一扫

专栏目录

KJammyHenry CSDN认证博客专家 CSDN认证企业博客

码龄1年

12: 原创

137万+: 周排名

12万+: 总排名

8379: 访问

: 等级

278: 积分

123: 粉丝

158: 获赞

8: 评论

101: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于QModelIndex、QStandardItem、QSelectionModel以及QTableview视图模型的实际运用与一些理解。
CSDN-Ada助手: 不知道 Vue入门技能树是否可以帮到你：https://edu.csdn.net/skill/vue?utm_source=AI_act_vue
回调函数的理解与具体使用过程（用纯虚函数做回调函数）
CSDN-Ada助手: 恭喜您写了第10篇博客！看到您对回调函数的理解与具体使用过程的深入探讨，我感到非常欣慰。纯虚函数做回调函数的方法也是一个很有意思的点子，能让我们对于回调函数有更深入的理解。希望您能继续保持创作的热情，不断分享您的见解和经验。下一步，我建议您可以尝试结合实际项目或者案例，来展示回调函数的具体应用，这样会更有说服力和实用性。期待您的下一篇作品！
基于QT和C++实现计算器，同时包括将中间过程及结果存入MYSQL数据库以及实现计算器之间的数据通信
CSDN-Ada助手: 恭喜您写了第9篇博客！标题看起来非常有趣和实用。您不仅实现了一个基于QT和C++的计算器，还将中间过程和结果存入MYSQL数据库，并实现了计算器之间的数据通信。这个功能强大的计算器一定会受到很多人的欢迎。对于下一步的创作建议，我谨慎地提出一些建议供您参考。首先，您可以考虑进一步优化计算器的界面和交互体验，使用户能够更方便地使用。其次，您可以尝试添加一些高级功能，例如图形绘制、单位换算等，以进一步提升计算器的实用性。最后，您还可以分享一些关于QT和C++的技巧和经验，帮助读者更好地理解和应用这些技术。希望我的建议对您有所帮助。期待您的下一篇博客！继续加油创作！
小白从0读论文之视频语义分割---------------Semantic Video Segmentation by Gated Recurrent Flow Propagation
CSDN-Ada助手: 恭喜您撰写了第8篇博客，内容涉及视频语义分割的研究，标题《Semantic Video Segmentation by Gated Recurrent Flow Propagation》。您的持续创作令人钦佩，不断分享学术领域的最新进展对读者们有着重要的启发作用。希望您在接下来的创作中，可以结合实际案例或者个人经验，为读者提供更具体、更实用的内容，期待您更多精彩的文章。
小白从0读论文之视频语义分割---------Pyramid Scene Parsing Network
CSDN-Ada助手: 恭喜作者第7篇博客的问世！看到你对视频语义分割的研究和Pyramid Scene Parsing Network的介绍，让我对这个领域有了更深入的了解。希望你能继续保持创作的热情和动力，分享更多的专业知识和经验。下一步，我建议你可以尝试结合实际案例，展示该网络在实际应用中的效果，或者探索该领域的未来发展方向。期待你更多的精彩分享！加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

KJammyHenry 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。