![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 88
andyL_05
EE 计算机视觉 机器学习 深度学习 算法
展开
-
论文笔记 - CFNet: Cascade and Fused Cost Volume for Robust Stereo Matching. CVPR 2021
论文笔记。本文是2021年CVPR的一篇文章,针对双目立体匹配任务。文章数提出了一种级联+融合的costvolume构造和回归策略,从而获得了高精度、对数据高鲁棒性的立体匹配结果。本文的切入点主要针对立体匹配的鲁棒性,指出由于数据集之间的差异以及视差分布的差异,导致很多算法只能在特定数据集获得很好的结果,迁移性和泛化性不足,这也严重制约了很多算法模型在真实场景的应用。因此,本文提出了CFNet采用融合+级联的方式提升立体匹配算法的鲁棒性。...原创 2022-07-22 19:50:08 · 1210 阅读 · 1 评论 -
论文笔记 - RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
这篇博客是对论文RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching的阅读笔记。论文地址位于,代码已开源,位于:RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching本文是一篇将光流算法RAFT迁移至立体匹配领域的文章,基于光路估计网络RAFT,提出了多级卷积GRU实现立体匹配的代价传播。文章对RAFT进行优化,并得到了一个高精度原创 2022-05-14 11:06:57 · 2309 阅读 · 1 评论 -
论文笔记 - Omnidirectional stereo depth estimation based on spherical deep network
论文笔记 Omnidirectional stereo depth estimation based on spherical deep network本文是2021 Image and Vision Computing上的一篇文章。IVC算是领域内认可度较高的期刊之一。本文针对双目全景深度估计,提出了基于球面卷积的级联网络,将全景图的平面投影转换到球面表示,获取了高精度的全景深度图。......原创 2021-09-15 20:59:06 · 1057 阅读 · 1 评论 -
训练过程中Loss突然变为NaN的可能原因与解决
训练过程中Loss突然变为NaN的可能原因与解决深度学习训练过程中,我们依赖模型当前参数训练得到的loss,根据所选择的优化策略,如Adam、SGD等得到参数步进调整值,对参数进行不断的调整,直到模型达到我们的预期。但在实际训练过程中,有时候会发现loss变为NaN或Inf的情况,导致训练无法正常进行。出现这种情况的原因主要有以下几点:1. 梯度爆炸2. 出现除零、对数函数自变量为负值等数学问题3. 出现坏样本1. 梯度爆炸训练过程中由于学习率等超参数设置的不合理,导致优化过程中没有减小los原创 2021-07-27 13:03:19 · 30524 阅读 · 14 评论 -
论文笔记 - BiFuse: Monocular 360◦ Depth Estimation via Bi-Projection Fusion. CVPR 2020
论文笔记 - BiFuse: Monocular 360◦ Depth Estimation via Bi-Projection Fusion. CVPR 20201. Introduction2. Related Work3. Approach4. Experimental Results实际测试:这篇博客介绍一篇CVPR2020的论文,这篇论文结合了全景图(360°图像)的两种常见投影方式,设计了融合模块及双分支神经网络,实现了出色的单目全景图深度估计性能。论文地址:https://ieeexplor原创 2021-03-06 22:03:00 · 1084 阅读 · 0 评论 -
论文笔记 - PSM-Net: Pyramid Stereo Matching Network. CVPR 2018
Pyramid Stereo Matching Network. CVPR 2018本文指出,通过立体图像对估计深度已经能够表征为监督学习任务并且通过卷积神经网络解决。但是已有算法都依赖于基于patch的孪生网络,缺乏对上下文信息的利用,难以找到非适定区域关联性。本文提出了金字塔立体匹配网络PSM-Net,主要包括了空间金字塔池化与3D CNN。空间金字塔池化能够通过多尺度累积获取全局语境信息,3DCNN能够通过堆叠沙漏网络及中间结果监督规则化cost volume,获取视差图。Introduction原创 2020-12-10 21:33:12 · 1035 阅读 · 0 评论 -
pytorch 使用预训练模型如resnet、vgg等并修改部分结构
pytorch 使用预训练模型并修改部分结构原创 2020-10-06 17:28:03 · 30591 阅读 · 13 评论 -
论文笔记 - Cycle-GAN Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
论文笔记 - Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks本文是ICCV 2017的一篇文章,也就是著名的Cycle-GAN一文。同时期研究生成模型的算法很多(现在依然有很多)起了各种xxxGAN的名字。CycleGAN是生成模型中很有启发性的一个工作,马和斑马的图也在网络上广为流传。论文和源码、模型都可以在作者的网页找到。AbstractIntroduction &&原创 2020-07-09 21:54:20 · 451 阅读 · 0 评论 -
【论文笔记】Generative Adversarial Frontal View to Bird View Synthesis - 论文阅读笔记
【论文笔记】Generative Adversarial Frontal View to Bird View Synthesis这篇论文是一篇发表在3DV会议上的文章,提出了基于GAN进行视角迁移与生成的方法,针对的场景是基于正面视角frontal view来生成俯视图bird view。作者提出了名为Bridge GAN的模型,结合homography,实现了由Frontal view生成Bi...原创 2020-07-08 20:36:11 · 341 阅读 · 0 评论 -
ubuntu20.04 编译安装早期版本(如2.2.1)的OpenEXR
ubuntu20.04 编译安装早期版本(如2.2.1)的OpenEXR在一些slam问题相关的源码编译时,往往需要OpenEXR。有一些SOTA的slam相关工作是比较早期完成的,当时依赖的OpenEXR版本可能比较早。本文介绍如何在较新的系统下自行编译安装老版本OpenEXR。apt 安装存在的问题对于比较新的系统,apt很可能是找不到老版本库的。apt 安装openexr可以直接通过:sudo apt install libopenexr-dev得到。但是一般是比较新的版本,比如ubun原创 2020-07-02 19:29:28 · 1376 阅读 · 0 评论 -
pytorch 网络train、eval以及在训练与测试时实现不同输出的方法
pytorch 网络train、eval以及在训练与测试时实现不同输出的方法深度学习网络往往都是通过训练过程将初始参数调优,然后通过训练后的模型进行测试与预测。对于一些场景,比如图像生成、深度图预测、分割等,有可能需要在训练过程中采用多尺度的思想,生成不同尺度的结果并计算loss,但是在测试与预测阶段,实际上只需要输出最后要求的一个尺度(分辨率)下的结果即可。这就需要我们在测试和训练时实现不同的输出。方法pytorch的网络模型有一个属性 training,用于判断当前模型是否处于训练阶段,因此,我们原创 2020-06-28 17:40:48 · 4413 阅读 · 4 评论 -
微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记
微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记今天观看了微软亚研院举办的 创研论坛 CVPR2020 论文分享会,分享会邀请了计算机视觉领域多个子领域的大佬们分享已发表的CVPR2020论文。除了论文分享外,还邀请了几位深耕CV领域多年的学界大佬进行了圆桌讨论。论文分享部分主要就 检测、多模态、机器学习、底层视觉、图像生成 几个方向,每个方向邀请了3-4位作者分享论文。这部分由于我也只是听了作者的介绍还没有认真阅读论文,暂时不讨论,后面精度过文章后再来分享。本文主要分享一下圆桌讨论时大佬们原创 2020-05-14 20:13:04 · 515 阅读 · 4 评论 -
Pytorch数据集的加载与使用
Pytorch 数据集的加载使用Pytorch数据集通常使用 torch.util.data.Dataset 以及 torch.utils.data.DataLoader完成。对于图像数据集,torchvision.datasets提供了一种加载数据集的方法,通过torchvision.datasets.ImageFolder将根目录下图像加载为dataset,其效果是将根目录下的指定子目录内...原创 2019-11-28 17:18:59 · 1195 阅读 · 0 评论 -
Win10+vs2019+OpenCV4.1.2的配置
OpenCV4.1.2在win10系统及vs2019下的配置1·简介本文介绍如何在win10下使用visual studio 2019以及cmake3.16.1进行OpenCV4.1.2+OpenCV_contrib的配置,以及配置过程中常见的问题。OpenCV是一个开源的跨平台计算机视觉库,官方网址:https://opencv.org/2·下载及编译目前OpenCV在win10下的安...原创 2019-12-23 21:01:46 · 685 阅读 · 0 评论 -
Pytorch 模型构建、训练、测试及预测
Pytorch 模型构建、训练、测试及预测本文以AlexNet识别手写数字为例,简要介绍如何使用pytorch构建网络模型,并进行训练、测试及预测所使用的环境:Ubuntu 19.04,python 3.7,pytorch 1.1.0,torchvision 0.3.01· Pytorch模型构建pytorch自定义网络模型较为简单,自定义class继承自(torch.nn.Module)...原创 2019-12-03 13:07:18 · 36384 阅读 · 7 评论