双目立体视觉论文阅读(1)STTR

最新推荐文章于 2024-08-24 07:25:04 发布

www.flybird.xyz

最新推荐文章于 2024-08-24 07:25:04 发布

阅读量1.5k

点赞数 1

分类专栏：深度学习立体匹配双目

本文链接：https://blog.csdn.net/u011832617/article/details/115321098

版权

STTR——《Revisiting Stereo Depth Estimation From a Sequence-to-Sequence Perspective with Transformers》
在这里插入图片描述
论文链接：
STTR
代码链接：
STTR

本文从Seq2Seq的角度重新审视了深度估计问题，使用位置信息和注意力将cost volume construction替换为密集的像素匹配。表现SOTA！性能优于Bi3D、GwcNet和LEAStereo网络，代码刚刚开源！

一.本文创新点：

1. 放宽了固定视差范围的限制;
2. 识别被遮挡的区域并提供估计的置信度;
3. 在匹配过程中施加了唯一性约束。

二.网络结构分析：

在这里插入图片描述

1. Feature Extractor

使用了沙漏网络结构，编码部分使用残差和金字塔池化，为了实现更高效的全局上下文采集。解码部分使用转置卷积&#x

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

www.flybird.xyz

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用立体视觉作为 3D LiDAR 的替代方案，在 KITTI ADAS 立体视觉数据集上微调立体变换器 (STTR) 模型-含数据集+源码资料下载

DT程序员的博客

04-09

423

本文详细介绍如何使用立体视觉作为 3D LiDAR 的替代方案，在 KITTI ADAS 立体视觉数据集上微调立体变换器 (STTR) 模型。这显着提高了深度感知的性能，尤其是在弱光和动态环境中，文中含源码和数据集资料下载

全新Benchmark框架！OpenStereo：开创双目立体匹配的新纪元

3D视觉工坊

12-23

1439

作者：Xianda Guo | 来源：3DCV添加微信：dddvision，备注：自动驾驶，拉你入群。文末附行业细分群导读???? [重磅发布] OpenStereo：开创双目立体匹配的新纪元！????是否曾想探索双目立体视觉的奥秘？OpenStereo为您揭晓！这个全新的Benchmark框架不仅支持6大主流双目数据集，还集成了12种先进网络。通过对双目立体匹配过程中的关键步骤：数据增强、特征提取、代价空间...

1 条评论您还未登录，请先登录后发表或查看评论

20篇双目视觉经典论文打包下载

05-24

30篇双目视觉经典论文打包下载

立体视觉的硕士论文

weixin_39099715的博客

02-23

154

https://wenku.baidu.com/view/21239cd6b14e852458fb57f1.html

【视觉-双目三维重建-理论篇】双目三维重建----论文调研2

开源节流

07-03

3160

双目视觉三维调研方法总结基于连续视差空间算法立体匹配算法基于连续视差空间算法采用欧式投影误差作为离群准则函数,建立RANSAC算法 D-H方法几何法和解析法相结合的方法结合图像速度和视差信息,通过最小二乘方法对目标的相对运动状态进行了重构;将重构状态作为伪测量,引入线性化的相对运动模型,采用扩展卡尔曼滤波方法对连续多帧图像信息进行序贯处理以改善估计精度。

《STTR：Revisiting Stereo Depth Estimation From a Sequence-to-Sequence Perspective with Transformers》

m_buddy的博客

09-13

2223

参考代码：stereo-transformer 1. 概述导读：这篇文章通过transformer机制实现了一种立体匹配算法（STTR），在该方法中将立体匹配问题转换为序列上的响应问题，使用未知信息编码与注意力机制替换了传统匹配方法中的cost volume策略。由于替换了cost volume解除了预定max-disparity假设的限制，增强了网络的泛化表达能力。在估计视差图的同时显示地估计遮挡区域的概率结果。此外，为了寻找右视图到左视图的最佳匹配，文中对其中的匹配矩阵添加熵约束，从而实现对匹配过程

【AI视野·今日CV 计算机视觉论文速览第186期】Fri, 6 Nov 2020

TomRen

11-08

1136

AI视野·今日CS.CV 计算机视觉论文速览视觉论文速览单目深度估计图像补全三维重建

【深度学习】语义分割-论文阅读：（ CVPR 2021）SETR：Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspe

zhe470719的博客

04-23

6553

这里写目录标题详情详情名称：Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers 单位：复旦, 牛津大学, 萨里大学, 腾讯优图, Facebook 论文：论文代码：代码

【双目论文整理未完】值得一读的双目论文整理

weixin_42492254的博客

12-30

1535

双目论文小整理，记录一些读过的论文

【立体匹配】双目深度估计论文综述及数据集汇总 Deep Stereo Matching paper review and datasets

ydd的博客，记录生活

01-09

9730

双目深度估计立体校正标定立体匹配论文综述及数据集汇总 paper review and dataset StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction. Single View Stereo Matching. Generalizing Deep Stereo Matching to Novel Domains. KITTI InStereo2K eth3d middlebury

三维视觉论文阅读：high-res-stereo2019双目立体视觉

Yan

01-16

1014

论文 Hierarchical Deep Stereo Matching on High-resolution Images 摘要本篇文章本人在看的时候，感觉特别像StereoNet和StereoDRNet。high-res-stereo强调了其在处理高分辨率影像的能力，并且也得到了非常漂亮的效果；另外，就是这篇文章也公开了代码，目前从issue的情况来看，论文的结果是可复现的！方法以下展示了high-res-stereo的网络结构，其实还是特征提取和代价回归两部分。 1. 特征提取 high-re

三维视觉论文阅读：mc-cnn2016双目立体匹配

Yan

12-15

1775

论文 Stereo Matching by Training a Convolutional Neural Network to Compare Image Patches 摘要本篇文章只关注“像素块相似度”这一块，仅仅是双目立体匹配中的一个小模块；导致文中还有大量传统方法的内容，不过这些东西不是现在应该讨论的重点，所以直接跳过了。方法早期的深度学习方法都还不是end2end，所以行文有点啰嗦。本篇文章大致分为数据集以及两个对应的网络。 1 数据集考虑到本文只关心像素块的相似度，因此作者用了一个很简

探索深度学习新境界：STereo TRansformer (STTR) 开源项目推荐

最新发布

gitblog_00471的博客

08-24

905

探索深度学习新境界：STereo TRansformer (STTR) 开源项目推荐 stereo-transformer项目地址:https://gitcode.com/gh_mirrors/st/stereo-transformer 在计算机视觉的深邃领域里，【STereo TRansformer (STTR)】项目如同一盏明灯，照亮了立体视觉估计算法的新路径。这个基于论文《Revisiti...

Revisiting Stereo Depth Estimation From a Sequence-to Sequence Perspective with Transformer——阅读阶段

MengYa_Dream的博客

08-21

2103

Revisiting Stereo Depth Estimation From a Sequence-to Sequence Perspective with Transformer Abstract 、Introduction、 Related Work、立体深度估计、 STTR与先前工作的对比、Attention Mechanism and Transformer The Stereo 、Transformer Architecture 、Feature Extractor、 Transform

STTR: Revisiting Stereo Depth Estimation From a Sequence-to-Sequence...(ICCV 2021)

flow_specter的博客

04-29

2317

2020年，Google在提出了一个将transformer应用在图像分类的模型ViT（vision transformer），具体思路为：将图像分为固定大小的patch，通过线性变化将其变为向量，并将这个向量们embeeding进transformer，之后便对其进行分类。transformer的结构通常来说是encoder+decoder，实质上，ViT仅仅使用了transformer的encoder部分，目的是提取特征。将2D的参考链接 https://mp.weixin.qq.com/s/zB

计算机视觉三大顶会论文ICCV,CVPR,ECCV

zhuimengshaonian66的博客

06-27

3873

原文：https://blog.csdn.net/u010551600/article/details/80799419 ICCV: http://www.informatik.uni-trier.de/~ley/db/conf/iccv/index.html ECCV: http://www.informatik.uni-trier.de/~ley/db/conf/eccv/index.h...

Attention-Based View Selection Networks for Light-Field Disparity Estimation论文阅读

wtlaibaodao的博客

06-23

484

提出了注意力机制的选择网络来进行视差估计，并且能够利用全部的视角进行视差估计。

【理论恒叨】【立体匹配系列】经典SGM：（1）匹配代价计算之互信息（MI）