几维wk-CSDN博客

原创【CAM技术】一口气带你读完经典CAM（类别激活图）论文

一口气带你读完经典CAM（类别激活图）论文，简单易懂品味经典方法！

2023-07-25 15:28:49 912

原创【弱监督学习】Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels

这是一篇在2022年发表在CVPR上的有关弱监督语义分割的文章，文章关注使用图像级标签进行语义分割弱监督训练。现有方法通常产生伪标签，然后通过某种方法对伪标签进行过滤，仅仅使用可靠的像素来进行弱监督训练，然而这样通常会损失大量的像素，导致许多没有被判定为可靠的像素没有被使用，为了提高无像素级标签数据的使用率，本文提出了了U2PL框架。

2022-11-01 11:34:12 1309 2

原创【弱监督学习】End-to-end weakly supervised semantic segmentation with reliable region mining

这是一篇2022年发表在Pattern Recognition期刊上的一篇有关弱监督语义分割的文章。由于只使用图像级标签来训练语义分割模型扔充满挑战，并且现有弱监督方法都是两阶段的方法，缺少一个端对端的方法。所以本文提出了一个新的端对端弱监督语义分割方法。

2022-10-25 20:29:20 1723 3

原创【弱监督学习】Weakly supervised segmentation of SAR imagery using superpixel and hierarchically adversarial

这是一篇2019年发表在Remote sensing期刊上的有关SAR图像语义分割的弱监督工作。这篇文章的动机是要解决现有的大多数方法通常忽略图像的外观和空间连续性、需要大量的训练数据、算法不能够实现实时性的问题。提出了一种结合条件GAN（CGAN）和CRF的一种弱监督语义分割方法。

2022-10-18 16:04:21 957

原创【弱监督学习】Learning deep semantic segmentation network under multiple weakly-supervised constraints ...

本文通过提出了一个多弱监督损失和动态优化策略，解决了目前遥感图像分类中存在的domain-shift的问题，并且很好地利用了无标签数据。

2022-09-29 11:12:17 705

原创【弱监督学习】Weakly Supervised Adversarial Domain Adaptation for Semantic Segmentation in Urban Scenes

本文着眼场景分割，主要解决在合成数据上训练的模型在真实数据上测试的性能下降的问题。通过构建一个DS网络，提取不同域中的object-level和pixel-level的特征，通过ODC和PDC进行对抗训练，从而使得DS能够更好地提取出domain-invariant的特征。整个训练过程中，Target域的数据只用到了object-level的标签，通过不精确（inexact）监督学习实现了Target域上的比较好的分割结果。

2022-09-27 16:23:26 661

原创【弱监督学习】Learning from Incomplete and Inaccurate Supervision

现在的有监督学习需要大量的高质量的标签才能进行，而在真实情况下，我们往往不能获得非常多的高质量标签，我们获取到的标签可能是不完全的，同时也可能是不准确的，当然也可能是既不完全、也不准确的。这时传统的有监督学习就面临比较大的挑战，而本文作者正聚焦于此，他提出一种新的方法能够在大量无标签数据的帮助下减少具有噪声的标签带来的负面影响。这种方法也就被称作不完全、不准确监督学习，也可以单纯的理解为弱监督学习。

2022-09-13 20:50:51 701

原创【SAR综述】复杂场景单通道SAR目标检测与鉴别方法

本文为文章《复杂场景下单通道SAR目标检测及鉴别研究进展综述》的内容整理

2022-04-21 17:54:52 2668

原创【视线估计】Light-weight Head Pose Invariant Gaze Tracking

本文研究的动机是不同多变的头部姿态会影响视线的回归结果。那么基于这个动机，作者主要提出来了一个解决方案，附带的提出了一个预训练的trick。

2022-04-15 16:13:50 854

原创【GAN超分辨】Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data

本文为ESRGAN的扩展，提出一个能够完全在合成数据上训练的面向真实场景的超分模型——Real-ESRGAN。

2022-04-06 17:58:32 4488

原创【PatchGAN】Image-to-Image Translation with Conditional Adversarial Networks

PatchGAN论文重点记录

2022-01-26 16:36:15 6458

原创【热成像超分辨率】 Unaligned Guided Thermal Super-Resolution

不用配准的引导式超分辨率

2022-01-24 16:12:07 3657

原创【对比学习超分辨】Blind Image Super-Resolution via Contrastive Representation Learning

对比学习超分辨率

2021-12-14 15:37:40 3930

原创【对比学习超分辨】A Practical Contrastive Learning Framework for Single Image Super-Resolution

基于对比学习思想的超分辨率文章。

2021-12-14 11:50:32 3842 2

原创【热成像超分辨率】Channel Split Convolutional Neural Network (ChaSNet) for Thermal Image Super-Resolution

一篇CVPRW2021关于热成像超分辨的文章

2021-12-06 11:48:39 3546 1

原创【热成像超分辨率】略读Thermal Image Super-resolution: A Novel Architecture and Dataset

要点1本文提出了一种新的CycleGAN结构有用热成像的超分辨率，并且提出了一个thermal图像的超分辨数据集（含有三种不同分辨率的数据集，是用三个不同的Thermal传感器拍的）。提出的结构生成器是由ResNet6构成，判别器是由PatchGAN构成。要点2之前的工作：《Thermal image superresolution through deep convolutional neural network. 》中用到的仅仅是101张分辨率为640x512的Thermal图像（没有不同分辨率的

2021-11-25 16:06:20 3037 1

原创【超分辨率】略读21年超分SOTA新算法——SwinIR

要点1目前超分的SOTA算法是基于CNN的，几乎没有用Transformer的研究。所以本文提出了一个超分的baseline：SwinIR，它包含三个部分，浅层特征提取、深层特征提取和高质量图像重建。深度特征提取是由几个残差的Swin Transformer块（RSTB）组成，并且整体有一个残差连接。要点2网络结构如下：SR任务训练时损失函数采用L1损失，对于图像去噪和JPEG压缩伪影重建任务上，使用Charbonnier loss。要点3MLP源码实现：其实就是全连接网络，用了GE

2021-11-22 10:39:45 5936 1

原创【超分辨率】何凯明新作:Masked Autoencoders Are Scalable Vision Learners

MAE。即可以说本文提出了一种新的自编码器，也可以说本文在计算机视觉领域提出了一个新的任务，即通过掩盖图像的一部分来利用没有掩盖的部分对图像进行重建。

2021-11-19 10:20:16 5186 3

原创【超分辨率】略读ECBSR

2021ACM MM关于轻量级超分辨文章

2021-11-16 17:48:31 5889 3

原创【自监督】何凯明新作MAE略读

要点1本文定义了一个新的任务：随机掩码图像重建任务。即随机的掩盖图像中的某些部分，然后重建出图像。要点2本文提出了一个掩码自编码器，用来解决随机掩码图像重建任务。该编码器是一个不对称的编码-解码器结构，将没有被掩盖的部分传入编码器进行编码，然后经过一个比较轻量级的解码器进行解码，从而实现重建任务。要点3作者总结说现在深度学习的方法大多数依靠不断加深模型来提高性能。在作者的研究中，在ImageNet上利用一个类似于NLP的简单方法就学到了一个强大的自编码器，这具有很强大的扩展性，让计算机视觉可能走

2021-11-16 10:07:17 2879 4

原创【超分辨率】Unsupervised Degradation Representation Learning for Blind Super-Resolution

这是一篇CVPR2021年的无监督深度学习超分辨率的文章。本文提出了一个种基于无监督退化表示学习的盲超分辨方法，该方法学习简单的退化表示来区分处于整个表示空间中的不同退化表示而不是在像素级的空间进行估计。本文还提出了一个退化感知超分辨率网络（DASR），这个网络可以基于学习到的退化表示来完成对图像的超分辨率任务。

2021-11-08 12:24:57 3870 2

原创【超分辨率】VDSR略读与训练细节

1.原文链接论文原文：Accurate Image Super-Resolution Using Very Deep Convolutional Networks2.前言这是一篇2016CVPR关于深度学习进行超分辨率的文章，核心思想是利用更深的网络和残差结构去完成SR任务的学习。3.核心问题使用更深的网络可以增加SR图像的质量，但是训练的收敛速度很慢。本文为了进一步提高SR图像的质量引入更深的模型，为了提高训练的收敛速度引入残差学习和提高学习率。4.整体结构整体的结构如上图，总的来看是一

2021-10-28 14:42:46 1226

原创【超分辨率】回顾深度学习超分辨率开山之作SRCNN

论文地址：Image Super-Resolution Using Deep Convolutional Networks要点1：本文发表于2016年，是深度学习做超分辨率的开山之作，开启了超分辨率的深度学习时代，在进行深度学习超分辨率的研究过程中，这篇经典的文章还是很值得回味的。传统的基于稀疏编码的超分辨率方法都是分好多个步骤对图像进行处理，本文提出一个端到端的网络来直接学习超分辨率映射，并且效果超过了现有的所有传统方法。要点2：整体的处理流程分三步，首先对输入的LR图像进行块提取和特征表示、

2021-10-19 16:43:49 1172

原创【超分辨率】5篇2021年CVPR超分辨率文章略读笔记

1.AdderSR: Towards Energy Efficient Image Super-Resolution要点1：本文采用加法网络（AdderNet）来实现对超分辨率任务的学习，使用加法是因为加法可以避免卷积产生的大量能量损耗，用人话来说就是卷积的乘法很费劲，很耗内存，用加法可能会更快。要点2：要想使用加法网络超分辨的任务，必须解决两个问题：第一个问题就是直接用加法网络无法很好地学习恒等映射（identity mapping），恒等映射就是ResNet中Shortcut短连接，即h(x)=

2021-10-19 12:25:38 3297

原创【超分辨率】Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution

0 前言这是一篇CVPR2020年的文章的文章，创新点主要在于不仅让网络学习LR->HR的映射，还学习HR->LR来减小映射空间，解决不适定的问题。

2021-10-13 19:58:21 1214

原创图像配准综述

论文题目：Image Registration Techniques: A Survey论文链接：pdf1.图像配准的应用场景多视图分析从多个视点进行对相似的目标和场景进行捕获可以获得更好的场景或者目标的表示。例如图像拼接和场景恢复等。多时相分析在不同时间捕获的相同目标或场景通常处在不同的条件，要去观察目标或场景的变化就可以合并连续的图像。例如运动跟踪、肿瘤生长跟踪。多模态分析使用不同的传感器获得相同的目标或场景的图片要合并不同的资源获得的信息以获得场景或目标的细节。2.图像配准的步骤1

2021-09-22 21:41:12 389

原创【视线估计】Realtime and Accurate 3D Eye Gaze Capturewith DCNN-based Iris and Pupil Segmentation

论文题目：Realtime and Accurate 3D Eye Gaze Capturewith DCNN-based Iris and Pupil Segmentation论文发表在 IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS期刊上，其工程技术方向为SCI 2区，计算机方向为SCI 1区。1 本文主要贡献a. 提出了一个将Unet和SqueezeNet结合的网络结构，实现瞳孔虹膜的分割以及闭眼检测。b. 将瞳孔虹膜的分割以

2021-07-05 15:45:31 2062 4

原创【视线估计】Appearance-Based Gaze Estimation via Evaluation-Guided Asymmetric Regression

这是一篇2018年北航博士Yihua Cheng发表的关于视线估计的论文，被ECCV收录。该论文通过多分支卷积神经网络提取双眼图像特征并结合头部姿态实现视线估计，通过设计非对称损失函数来估计双眼图像对于视线估计不同的重要性，最终实现比较好地视线预测。

2021-04-22 15:56:17 2059 2

原创【论文详解】Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes

基于HRNet，本文提出一种新的深度双分辨率网络（deep dual resolution network，简称DDRNet）。DDRNet有两个并行的分支，深度分支用来获得高分辨率的特征表示，语义分支用来提取丰富的语义信息。

2021-04-12 14:59:58 3177 4

原创【图像Transformer论文理解】AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

完全抛弃CNN，Transformer也能进行图像识别

2021-03-17 17:04:48 1664

原创【深度学习】Global Pooling，Depth-wise Convolution， Concatenate

最近在读BiSeNet的两篇论文，遇到了三个以前没有接触过的操作，本文来就这三个操作进行简单的讲解以及Pytorch代码实现的思路。1.Global PoolingGlobal Pooling，中文是全局池化，其实是一种比一般池化还要简单的池化操作。在一般的池化中，我们需要用一个类似卷积核一样的东西，来规定步长从而进行取最大值或者平均值的操作，也就是我们常说的最大池化或者平均池化，这种操作通常会改变特征图的尺寸，而改变后的尺寸计算与卷积的计算完全一致。而Global Pooling就十分简单了，它直接就

2020-11-17 12:46:09 1587

【视线估计】ARE-gaze estimation网络结构Pytorch代码

空空如也