#今日论文推荐# 谷歌联合高校发布端到端的全景分割方法MaX-DeepLab，图像分割的伪影大幅减少且不含手动模块

最新推荐文章于 2024-07-12 16:21:48 发布

wwwsxn

最新推荐文章于 2024-07-12 16:21:48 发布

阅读量99

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能

原文链接：https://www.aminer.cn/research_report/62f128e27cb68b460ffe9404

版权

深度学习专栏收录该内容

716 篇文章 30 订阅

订阅专栏

#今日论文推荐# 谷歌联合高校发布端到端的全景分割方法MaX-DeepLab，图像分割的伪影大幅减少且不含手动模块

图像分割技术在计算机视觉领域十分重要，通过它计算机才能将图像中的不同对象进行分割，进而理解图像内容并用于下一步的处理，这一技术被用于自动驾驶、图像识别等中。
一般来说图像分割任务是通过为属于同一类的每个像素分配标签来实现的，而其中的任务也通常涉及到对对象进行分类、检测和标记等。
图像分割大体可以分为三类：语义分割、实例分割和全景分割。“语义分割旨在为图像中的所有像素分配一个类标签；而实例分割的目的则是清楚地检测出图片中某个类的每个实例；全景分割则融合了这两种任务，是近年来新兴的分支，它主要通过预测一组不重叠的掩码及其对应的类标签来完成任务，”如下图所示。

目前的全景分割方法中的对掩码的预测这一步骤，都是通过采用多个代理子任务逐渐逼近目标来完成的。这使得之前的全景分割方法比较依赖代理子任务。
例如 Panoptic-FPN 方法的架构，就是采用了含有三个代理子任务层级的”基于框的管道”，如下图中粉红颜色的数状结构所示，全景分割掩码任务被分解为合并语义和实例分割这两个子任务，而实例分割又被进一步分解为框检测和基于框的分割，而框检测是通过锚回归和锚分类实现的。

论文题目：MaX-DeepLab: End-to-End Panoptic Segmentation with Mask Transformers
详细解读：https://www.aminer.cn/research_report/62f128e27cb68b460ffe9404https://www.aminer.cn/research_report/62f128e27cb68b460ffe9404
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
#今日论文推荐# 谷歌联合高校发布端到端的全景分割方法MaX-DeepLab，图像分割的伪影大幅减少且不含手动模块

为了解决这一问题，谷歌研究院联合大学专家提出了一种端到端的方法 MaX-DeepLab。该方法直接从图像中来预测全景分割的掩码，大大简化了整个过程，而且全程不涉及手动模块。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。