自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 基于transformer的多帧自监督深度估计 Multi-Frame Self-Supervised Depth with Transformers

多帧深度估计除了学习基于外观的特征外,也通过特征匹配利用图像之间的几何关系来改善单帧估计。我们采用深度离散的核极抽样来选择匹配像素,并通过一系列的自我和交叉注意力来细化预测,这构成了一种新的基于transformer的成本量。这种方式可以改善歧义和局部极小值的标准相似度。方法在KITTI和DDAD上进行测试,效果良好。

2023-03-08 17:20:16 1182 7

原创 时间机会主义者:自监督多帧单目深度 The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth

大多数的单目深度估计网络在训练时都没有采用时间序列最为约束信息,本文提出了一种Manydepth,基于立体匹配,提出了一种基于端到端成本量的深度估计网络,并且提出了新的一致性损失,在面对运动物体时,鼓励网络忽略掉成本量,并且提出了一种应对静态相机的增强方案,在KITTI和Cityscapes上效果良好。

2022-11-23 17:29:50 637

原创 解释无监督多帧弹幕深度估计的物体运动和遮挡 Disentangling Object Motion and Occlusion for Unsupervised Multi-frame Monocul

传统的自监督单目深度估计是基于静态世界的假设所建立的,所以运动物体会导致深度估计精度下降。现有的方法尽在训练损失级别上解决了运动物体的失配问题,而本文提出了一种新颖的多帧单目深度估计方法,通过动态运动解释模块(DOMD)来解决适配问题,并设计了新的遮挡感知成本体积和再投影损失。在cityspaces和kitti上效果良好。

2022-11-09 15:34:53 554

原创 MGNet:自动驾驶的单目几何场景理解 MGNet: Monocular Geometric Scene Understanding for Autonomous Driving

首次提出了单目几何场景理解,并将单目几何场景理解定义为全景分割和自监督单目深度估计(场景理解是计算机视觉中的一个大类,图像分割,检测,识别都算是里面的一种任务,这个定义有点勉强了,还以为是国人,没想到是英文名字)。本文注重于提升响应速度。在KITTI和Cityscapes上进行了测试,效果良好。

2022-09-14 17:41:16 961

原创 用于深度估计的边缘增强自适应加权网络ADAPTIVE WEIGHTED NETWORK WITH EDGE ENHANCEMENT MODULE FOR MONOCULAR SELF-SUPERVIS

自监督单目深度估计广泛的应用与其他领域,但是目前的方法不能很好的预测图像边界的深度信息,因为遮挡和纹理系数会导致光度一致性评估错误。为了解决上述问题

2022-06-29 15:50:30 995 4

原创 用于密集预测的视觉转换器 Vision Transformers for Dense Prediction

  我们提出了一种视觉转换器,一种利用视觉转换器代替卷积网络作为密集预测任务的骨干架构。本文将视觉转换器各个阶段的toker(翻译是令牌,但我感觉更像一个图像块)组装成各个分辨率的类图像表示,然后在解码器阶段进行组合,从而生成全分辨率预测。transformer采用恒定且相对较高的分辨率表示,并且在每个阶段都具有全局感受野。与全卷积网络相比,这些特征可以提供更细粒度和更全局连贯的预测。实验在深度估计和图像分割两个方向都产生了显著的效率提升。  目前几乎所有的密集预测框架都是基于卷积网络的编解码器结构,他们通

2022-06-16 17:14:29 1040

原创 面向实际应用的室内单目深度估计 Toward Practical Monocular Indoor Depth Estimation

Toward Practical Monocular Indoor Depth Estimation面向实际应用的室内单目深度估计0 Abstract  现有的大多数单目深度估计方法都是在室外的驾驶场景中部署,由于室内的物体在距离摄像头较近的位置排列紧密且无规则,这种方法在室内的泛化性很差(场景不同导致模型的泛化性很差是基于数据驱动的方法的通病,这一点无可厚非,但是室内的环境总体上要比室外的环境复杂,这一点确实存在)。为了提高模型的鲁棒性,我们提出了一种结构蒸馏方式,从现成的相对深度估计器中学习诀窍,

2022-06-01 10:36:42 1294

原创 基于分段平面性的单目深度估计 P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior

P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior面向可解释深度网络的单目深度估计0 Abstract  单目深度估计对于场景理解和后续任务至关重要,本文致力于改进监督方法,其中地面真值只在训练的时候使用。基于对真实3D场景高度规则性的了解,我们提出了一种学习有选择地利用共面像素信息来提升预测深度的方法。我们引入了一种分段平面性先验知识,即对于每个像素,有一个种子像素和前者共享相同的平面3D曲面。基于此,我们设计了一

2022-05-18 18:38:32 1264

原创 面向可解释深度网络的单目深度估计 Towards Interpretable Deep Networks for Monocular Depth Estimation

Towards Interpretable Deep Networks for Monocular Depth Estimation面向可解释深度网络的单目深度估计网络的可解释性:通过数据实验描述神经网络内部每一层甚至是每一个神经元所完成的功能。0 Abstract  近期单目深度估计(MDE)取得了可喜的进展,我们有必要进一步了解网络的内部解释性。现在的方法通过视觉线索来提供事后解释,这无法探索深度估计网络的内部表示。在本文中,我们发现网络的一些隐藏单元对深度范围具有选择性,这种行为可以作为内部表

2022-04-20 16:21:44 4021 12

原创 粒度语义感知表示增强的自监督单目深度估计 Fine-grained Semantics-aware Representation Enhancement

Fine-grained Semantics-aware Representation Enhancement for Self-supervised Monocular Depth Estimation用于自监督单目深度估计的细粒度语义感知表示增强0 Abstract  自监督单目深度估计由于其实用价值和最近的一些有前途的改进从而得到了人们广泛的关注。然而,大多数研究工作忍受着光度损失的有限性,尤其是在弱纹理和对象边界。为了克服这一缺点,本文提出了一种跨域的语义辅助手段,本文目的在于通过隐士语义知识

2022-04-05 16:53:04 3203

原创 StructDepth:利用结构规律进行自我监督的室内深度估计StructDepth: Leveraging the structural regularities for self-supervis

StructDepth: Leveraging the structural regularities for self-supervisStructDepth:利用结构规律进行自我监督的室内深度估计0 Abstract  在户外的数据集上,自监督单目深度估计已经取得了令人影响深刻的性能。然而,由于缺乏纹理,自监督单目深度估计的性能在室内显著下降。如果缺乏纹理信息,光度损失的约束性能就会下降,无法训练出好的深度网络。受早期室内建模工作的影响,本文利用室内场景中表现出来的结构规律,训练出更好的网络。总体

2022-03-23 17:21:03 3958 22

原创 基于域分离的全天图像自监督单目深度估计 Self-supervised Monocular Depth Estimation for All Day Images using Domain Separ

Self-supervised Monocular Depth Estimation for All Day Images using Domain Separation基于域分离的全天图像自监督单目深度估计0 Abstract亮点:对于全天道路深度估计中的早晚图像差异过大问题。提出了一个域分离自监督单目深度估计网络,主要用来提升同一个网络在白天和晚上两个场景中的深度估计精度,将白天图像和晚上图像的特征分为私有特征和共同特征,采用正交损失来确立私有特征和共同特征的不同。深度估计21年顶会文章对于遮挡和

2022-02-22 09:23:57 3233

原创 卡达的第四枪

  命运对勇士低语:“你无法抵御风暴”。勇士低声回应到,“我,就是风暴!”  现在是2022年2月1号,大年初一。

2022-02-01 09:24:12 327

原创 君与秋逐鹿

以下文字来自抖音博主拾芥,侵删!  中国人的浪漫在文字中体现的淋漓尽致,一开始还以为博主是情侣组合,刚刚为了记录点开直播,才发现是姐弟,瑞思拜!以下从后到前记录了该播主的每一条抖音文案,意境太美,再次瑞思拜!你是拥有山川河海的神明,而我是因与神明交错而发光的少女,愿我的神明保有能越过山林,游动海浪的灵力, 愿我的神明常驻此地,眼里有我。这是我第一次跟你说新年快乐,愿你周遭是晴明,眼角是笑意,耳畔是阜盛烟火,心上凛冬散尽,星河长明!那就以过客之名,祝你岁岁平安。今晚月色很美,姐姐你也是。“我带你

2022-01-11 22:28:22 2050

原创 何以与君识

  何以与君识,唯有泪千行。这是出自LOL的一句对白。很有意思的对白,宿命相遇的两人,为了各自的执着和信念,对立生死。  最近有两件事,一件事是改论文,一件事是追秋露。  想分开说的,可能分开能说的清楚明白,可是这里是我的博客,为什么也要按照给他人看的框架去写,论文迫害的已经够多了,这一点点的慰籍,在这里,请允许我随性一点吧。  论文是大事,我依靠了很多别人,王老师改了两遍英文,大师兄也改了两遍。却还是不行,存在着很多问题,我有点迷惑,不知道怎样才算好,怎样才算坏。我只知道,我自己翻译的很差,没有用心

2022-01-07 22:07:33 937

原创 通过实例感知学习动态场景 Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection Consistency

通过实例感知学习动态场景中的单目深度 Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection Consistency0 摘要提出了一个端到端的联合训练框架,贡献有以下三个方面。强调了运动物体正向投影和反向投影的区别,使用正向投影模块提出了在几何上正确的投影通道...

2021-12-07 11:06:44 2937

原创 一种新的阈值描述方法。

一种新的阈值描述方法。

2021-12-06 10:21:24 101

原创 故乡散记(一)

  梦,在科学上解释为人在熟睡时大脑的无意识活动所形成的产物集合。人们常说,日有所思,夜有所梦。例如白天看了恐怖片,晚上会做噩梦等等诸如此类。我还记得我小时候的一个梦,怪兽在破坏城市,我作为英雄之类的人物登场,一番鏖战后自己的爱人死亡,我记不得她的脸,但是记得她柔顺的长发随风飘荡,娇小的身躯无力的躺在我的怀里,我就这样抱着她,哭的撕心裂肺,死去活来。  她的阵亡过程我早都记不清了,我只能记得已经应该很爱她。小时候当然不知道什么叫爱,虽然现在可能也不知道,但是失去她的那种心碎和无力的感觉,却犹如付骨之蛆一般

2021-10-09 09:57:25 125

原创 纣王与妲己

纣王与妲己  今天也没什么心情来长篇大论,不过是当日记来随便写一点吧。  歌曲《苏幕遮》里面有一句“棋逢红颜一醉,千军万马退”。这一句我是很喜欢的。原因可能就是沉沦与古风的半推半就的含蓄吧。又看到bilibili上推的纣王和妲己,有感而发。想起罗翔老师的一句话,要爱具体的人,不要爱抽象的人。可是由于我无法找到具体的人,却反而更加爱抽象的人了。我以前无法理解罗老师的话,抽象的人不是比具体的人更加美好吗?为什么呼吁我们去爱具体的人呢?后来的一天,我看到他讲淫秽视频对于成年人的危害时我顿悟了,他讲淫秽视频为了

2021-08-17 20:47:05 335

原创 深度和自我运动自监督学习的特征度量损失 Feature-metric Loss for Self-supervised Learning of Depth and Egomotion

原文  视频/图像质量评价指标是指通过主客观的方式对主题内容相同的图像信息的变化与失真进行感知、衡量与评价。

2021-07-21 09:41:18 720

原创 自监督单目深度估计:通过语义引导解决目标问题 Self-Supervised Monocular Depth Estimation:Solving the Dynamic Object Problem

Self-Supervised Monocular Depth Estimation:Solving the Dynamic Object Problem(自监督单目深度估计:通过语义引导解决目标问题)0 摘要  提出一种新的语义引导的深度估计(SGDepth)方法来处理运动的动态类问题(DC),例如运动的汽车和行人。采用有监督的语义分割和自监督的深度估计进行互利跨域训练,提供防止移动对象污染的光度损失的语义遮蔽方案,以及对非移动对象的检测方法。...

2021-04-26 21:57:53 1991 1

原创 单目深度估计的评价指标

目前评价单目深度估计最常用的量化指标是绝对相对差(AbsRel)、均方根误差(RMSE)、RMSE(log)和相对误差(SqRel)。以下为各量化指标的计算公式。  其中di是真实的深度信息,di* 为预测的深度值,在深度估计有有三个常用的阈值thr=1.25,1.252,1.253,在比较真实的深度di和预测的深度di*时,可以采用如下的方法。选取di/di* 和 di*/di两个之中的最大值,统计所有di中小于阈值thr的像素点所占总体像素点的白分比,越接近于1效果越好,所以阈值越大,即

2021-04-19 20:50:14 7291 5

原创 虚拟环境指令

1.环境创建相关查看虚拟环境列表conda ebv list进入虚拟环境#SHS为创建好的名字source activate SHS退出虚拟环境conda deactivate

2021-04-14 20:19:03 500

原创 动态场景下的无监督单目深度学习 Unsupervised Monocular Depth Learning in Dynamic Scenes

Unsupervised Monocular Depth Learning in Dynamic Scenes(动态场景下的无监督单目深度学习)在视频序列中,当运动前后两帧相隔时间较短时,我们认为两帧图片的位姿变化和明暗变化都是存在着一定的范围的,即有光度一致性和几何一致性损失。光度一致性:指在相邻的两帧之间同一个点的像素值集合不会有太大的变化。几何一致性损失:即两帧之间图片中的位姿变化不会有较大波动。极线:如果曲线上两点A,B的切线交于P点,那么P点称为直线AB关于该曲线的极点,PA,PB称为P点的

2021-04-13 21:40:47 941

原创 pytorch函数记录

nn.ConvTranspose2d详细描述个人认为就是一个卷积和逆卷积的过程,例如,由5 * 5到3 * 3卷积提取特征,得到3 * 3的特征图,再通过3 * 3 到 5 * 5逆卷积得到5 * 5的特征图。该博主讲的通俗易懂,虽然能理解过程,但是不是很懂意义。...

2021-03-28 20:31:59 76

原创 闲云野鹤(一)

2021-3-15到2021-3-30  本科的时候就有写东西记录的习惯,不过当时大多是为了拿素质分参加各种投稿。我在以前的文章里写过,写东西是一种发泄方式,当然虽然现在我有了健身这样的另一个选项。不过好久没写了,关于写文字这样的事,我在以前也讨论过,实在是不太愿意按照既定的格式来,还是随性所欲来的舒畅。不过关于上面讲的本科开始,我还是想说一下,其实我高一的时候就在写了。  这次没有什么要讨论的事,就是想随笔记录一下,也有可能像胡适一样,说着要戒赌,但后面每日笔记还是打牌。不过我一直有这样的观点,就是时

2021-03-28 20:27:57 176

原创 基于无监督的单深度估计

Atlas: End-to-End 3D Scene Reconstruction from Posed Images(论文复现)从姿势图像进行端到端的3D场景重建,该论文发表在2020的ECCV上,我首次见到是在小破站上,该论文主要进行的是一个针对于视频序列的三维重建,B站视频网址,该视频效果极其震撼,故产生了复现该论文的念头,在网上查找发现没有人做过这方面的工作(指公开),所以写此博客,以便记录。论文PDF,github源码。evaluate.py# Copyright 2020 Magic Le

2021-03-28 19:10:20 853 9

原创 CSDN小技巧记录

每次写CSDN总会遇到各种问题,百度固然方便,但总是要找要区分的,索性自己专门写一篇来记录一下吧。1.首行缩进两个字符,即两次空格&emsp;&emsp;实现效果  首行缩进两个字符,即两次空格。2.文字居中<center>实现效果文字居中...

2021-03-08 18:52:00 133

原创 无监督深度估计论文阅读

Unsupervised Monocular Depth Estimation with Left-Right Consistency  这篇文章可以看做时无监督深度估计的里程碑之作,主要思想是针对于一个双目摄像头左图与右图相互递归,实现网络的训练过程,由于视差图与深度图互为倒数,所以可以通过得到视差图的方法来得到深度图。以下这一段是一个博主的解释原文链接  这种方法的大体思路是这样的,首先我假设有一个双目摄像头,我将双目摄像头的左图作为整个网络的输入,经过一个卷积神经网络我的输出是两张分别对应双目摄

2021-03-08 18:51:21 1135

原创 基于无向图的城市间快递派送算法

1.题目分析1.1题目简介假设你为快递公司设计快递投递路线优化程序。(1)每个市有个中转分发点,有些城市之间有直通路线,有些城市之间没有直通路线;(2)城市与城市之间的运费计算公式为:距离*1;(3)设投递包裹的尺寸、重量都一样,每条运输线路有个运力上限(即只能运输多少个包裹)。要求:(1)随机产生当天的包裹投递需求;(2)对所产生的包裹需求,生成运输路线策略。(3)(拓展要求):根据随机测试结果,利用程序优化城市间包裹线路。1.2分析思路由上述的题目简介可知,在本次课程设计中,我们主要解决的有以

2020-12-14 14:45:53 3446

原创 opencv学习日记(二)

一、视频的基本处理opencv中提供可以处理视频的类VideoCapture,通过对VideoCapture合理利用,可以打开avi,MP4等格式的视频文件,也可以调用本地摄像头,对摄像头采集的视频进行处理。通过提取视频中的每一帧图像,可以将视频处理问题转化为图像处理问题。1、视频文件的读取代码如下#include<opencv2/opencv.hpp>using names...

2019-08-06 18:26:26 172

原创 opencv学习日记(一)

一、opencv的安装关于opencv的安装,本人在此就不再赘述了,网上相关教程很多,我个人比较推荐以下博主链接: link.https://blog.csdn.net/qq_41175905/article/details/80560429安装过程真的很详细(虽然我是看了其他博主的安装过程,但还是强烈推荐该博主),由于我用的是VS2017,部分同学可能采用VS2015或其他版本,但安装过...

2019-08-06 08:35:41 177

原创 基于FPGA的帧同步设计

一、题目背景在数字时分多路通信系统中,为了能正确分离各路时隙信号,在发送端必须提供每帧的起始标记,在接收端检测并获取这一标志的过程称为帧同步。帧同步有起止式同步法和插入特殊同步码组法两种。要求开机后整个系统要能很快地进人帧同步,或一旦帧失步后,能很快恢复帧同步。帧失步将使信息丢失,对于语音通信来讲,人耳不易察觉出小于100 ms的通信中断,所以一般认为帧同步恢复时间在几十毫秒量级是允许的。本次...

2019-07-21 10:01:02 5996 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除