![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
知识学习系列
文章平均质量分 90
m0_61899108
这个作者很懒,什么都没留下…
展开
-
【综述】Diffusion Models: A Comprehensive Survey of Methods and Applications
论文:github:Conditional Image Generation (Image Super Resolution, Inpainting, Translation, Manipulation)原创 2023-10-19 21:57:57 · 2543 阅读 · 0 评论 -
ubuntu修改IP地址
面对ubuntu18以上的版本,主要有两种界面:图形化界面和纯命令行界面。图形化界面配置比较简单,命令行配置稍许复杂,但方便。原创 2023-10-14 13:20:23 · 22661 阅读 · 0 评论 -
【论文合集】Awesome Diffusion Models 3
介绍使用diffusion来实现多模态学习、3D视觉、对抗攻击,以及语音领域的生成、增强等任务。转载 2023-10-17 15:52:27 · 18891 阅读 · 0 评论 -
【论文合集】Awesome Diffusion Models 2
介绍diffusion做生成、分类、分割、图像翻译、医学图像的论文。来源:https://github.com/diff-usion/Awesome-Diffusion-Models转载 2023-10-17 12:56:41 · 6453 阅读 · 0 评论 -
【论文合集】Awesome Diffusion Models 1
介绍关于diffusino的各种资源和综述论文。转载 2023-10-16 22:13:30 · 1922 阅读 · 0 评论 -
【论文合集】Awesome Video Diffusion
A curated list of recent diffusion models for video generation, editing, restoration, understanding, nerf, etc.原创 2023-10-07 15:08:45 · 2456 阅读 · 0 评论 -
【NeurIPS 2023】Backdoor对抗攻防论文汇总
2023年以及2022年的NeurIPS有关backdoor的对抗攻防的论文。原创 2023-10-05 13:00:44 · 5069 阅读 · 0 评论 -
SAM(Segment Anything)大模型论文汇总
SAM大模型论文汇总原创 2023-08-01 21:02:42 · 5208 阅读 · 0 评论 -
有关Loss的博客
有关loss的博客原创 2023-06-25 16:54:29 · 2909 阅读 · 0 评论 -
半监督分割:从数据增强到学习范式
图像分割应用的最大阻碍是缺乏高质量标注的训练数据。深度分割模型的泛化能力依赖大规模和高质量的像素级标注数据。 事实上,图像分割标注是一个昂贵且耗时的过程。对于新的任务或是需要快速应用的场景,数据稀缺问题更为严重。因此,数据标注的高成本降低了模型在新任务和扩展性,从而阻碍了深度分割模型在现实中的应用。为了缓解数据标注压力,当前已有大量的工作来进行半监督和弱监督的图像分割。例如,利用少量精确标注的数据、稀疏的标注、带噪声的标注、分类标注或者以上几种组合实现半监督图像分割模型。 然而,半监督图像分割具有其天然的转载 2023-06-08 09:17:08 · 1070 阅读 · 0 评论 -
Latex常用符号
介绍Latex常用的符号表示。转载 2023-06-04 14:49:39 · 877 阅读 · 0 评论 -
【论文合集】Awesome Backdoor Learning
关于后门攻击&防御的博客与论文。原创 2023-05-19 12:43:42 · 2437 阅读 · 0 评论 -
【论文合集】Awesome Object Detection in Aerial Images
A curated list of awesome resources for generic object detection in aerial images.原创 2023-05-17 20:49:37 · 953 阅读 · 1 评论 -
【论文笔记】数据增强系列.1
本文简单介绍数据增强、好处和常见方式,以及最近的三篇数据增强的论文:CutMix(ICCV2019),ContrastMask(CVPR2022),BCP(CVPR2023)。数据增强是深度学习中的一种技术,它通过从现有数据生成新的训练数据来扩展原数据集。数据增强工具通过操作现有数据的参数,将数据转换为新的、独特的样本。可以对图像、文本、音频和视频输入执行数据增强。有两种类型的数据增强:离线(增强图像存储在驱动器上,然后在训练模型之前与真实数据相结合)和在线(数据增强应用于随机选择的图像并用于训练原始数原创 2023-05-16 21:43:20 · 2183 阅读 · 0 评论 -
【半监督学习】Match系列.3
半监督语义分割旨在利用尽可能少的有标注图像以及大量的无标注图像来学得一个较好的分割模型。其中,对有标注图像的学习一般类似于全监督语义分割,如计算预测结果与人工标注之间的交叉熵损失,问题的关键在于如何利用无标注图像。本文简单介绍半监督算法中的Match系列方法:FreeMatch(ICLR 2023),SoftMatch(ICLR2023),UniMatch(CVPR2023)。原创 2023-05-13 20:55:31 · 1400 阅读 · 0 评论 -
【半监督学习】Match系列.2
本文简单介绍半监督算法中的Match系列方法:CoMatch(ICCV2021),CRMatch(GCPR2021),Dash(ICML2021),UPS(ICLR2021),SimMatch(CVPR2022),AdaMatch(ICLR2022)。原创 2023-05-07 22:23:52 · 1695 阅读 · 0 评论 -
【半监督学习】Match系列.1
近来半监督图像分类任务有两大核心方法:一致性正则(Consistency Regularization)和打伪标签法(Pseudo-Label)。本文简单介绍半监督算法中的Match系列方法:MixMatch(NIPS 2019),ReMixMatch(ICLR 2020),FixMatch(NIPS 2020),FeatMatch(ECCV 2020),FlexMatch(NlPS 2021)。原创 2023-05-06 11:30:15 · 1114 阅读 · 0 评论 -
【论文合集】Awesome Segmentation Domain Adaptation
近些年,图像分割领域适应相关论文。转载 2023-04-18 11:54:40 · 539 阅读 · 0 评论 -
【论文合集】Awesome Label Noise Learning and Image Denoising
噪声学习和高光谱遥感影像去噪方法的paper合集。原创 2023-04-24 23:52:59 · 1372 阅读 · 0 评论 -
【论文合集】Amesome Image Deblurring
图像去模糊近几年论文合集https://github.com/subeeshvasu/Awesome-Deblurring原创 2023-04-10 10:58:02 · 947 阅读 · 0 评论 -
【论文合集】Awesome Low Level Vision
介绍Low-level任务以及视觉顶会中的相关文章。原创 2023-04-10 10:45:29 · 4600 阅读 · 1 评论 -
Segment Anything (CV的GPT-3时刻)
Meta 发布首个可“任意图像分割”的基础模型 Segment-Anything Model(SAM)和最大规模的“任意分割 10 亿掩码数据集「Segment Anything 1-Billion mask dataset (SA-1B)」,将自然语言领域的 prompt 范式引入了 CV 领域,进而为 CV 基础模型提供更广泛的支持与深度研究。转载 2023-04-06 17:30:22 · 1357 阅读 · 0 评论 -
【论文合集】Semi-Supervised Semantic Segmentation
Semi-Supervised Semantic Segmentation原创 2023-04-07 09:42:26 · 2017 阅读 · 0 评论 -
目标检测 | 从基础架构ResNet到GhostNetV2
目标检测是指在图像或视频中分类和定位物体的任务。由于其广泛的应用,最近几年目标检测受到了越来越多的关注。本文概述了基于深度学习的目标检测器的最新发展。同时,还提供了目标检测任务的基准数据集和评估指标的简要概述,以及在识别任务中使用的一些高性能基础架构,其还涵盖了当前在边缘设备上使用的轻量级模型。在文章的最后,我们通过以图表的形式直观地在多个经典指标上比较了这些架构的性能。转载 2023-05-28 19:30:54 · 1181 阅读 · 0 评论 -
【综述】半监督语义分割
图像分割是最古老、研究最广泛的计算机视觉 (CV) 问题之一。图像分割是指将图像划分为不同的非重叠区域,并将相应的标签分配给图像中的每个像素,最终获得ROI区域位置及其类别信息。一般,我们将分割任务分为语义分割和实例分割,前者是将每个像素与相应的语义类别进行分类,从而为属于该类别的所有对象或图像区域赋予相同的类别标签;后者则更进一步,试图区分出同一类别的不同实例(如上图所示)。本文主要围绕语义分割进行展开介绍。转载 2023-04-12 22:22:10 · 1207 阅读 · 0 评论 -
增量学习入门
增量学习(Incremental Learning),亦称为持续学习(Continual Learning)或终身学习(Life-Long Learning),是一种机器学习方法,它允许模型通过对新数据进行持续学习而不是重头训练整个模型。这种方法允许模型不断地学习新的知识,并在不断实际复杂多变的环境变化。转载 2023-04-08 23:29:45 · 2875 阅读 · 0 评论 -
语义分割的盘点与亿点思考
回顾语义分割的发展史,包括图像分割任务的定义、背景和实际应用,同时介绍了传统图像分割的一些经典算法以及基于现代深度学习的语义分割技术演进,剖析现有的语义分割框架。转载 2023-05-15 18:57:14 · 813 阅读 · 0 评论 -
机器学习专业术语速查表(高频版)
机器学习专业术语速查表(高频版)转载 2023-04-05 22:14:36 · 144 阅读 · 0 评论 -
深度学习中的生成对抗网络GAN
GANs本质上属于机器学习中的生成模型系列,与其他生成模型(如变分自动编码器)相比,GANs能够有效地生成所需要的样本,消除确定性偏差,并且与内部神经网络结构具有良好的兼容性。这些特性使GANs在计算机视觉领域获得了巨大的成功。尽管GANs至今已取得了巨大的成功,但将其应用于现实世界仍存在许多挑战,最主要的难点为:高质量图像的生成生成图像的多样性训练的不稳定性转载 2023-04-01 11:49:11 · 681 阅读 · 0 评论 -
【论文合集】RGBD Semantic Segmentation
A paper list of RGBD semantic segmentation原创 2022-12-07 17:03:39 · 1797 阅读 · 0 评论 -
【论文合集】Awesome Anomaly Detection
Anomaly Detection: The process of detectingdata instances that significantly deviate from the majority of the whole dataset.原创 2023-03-29 10:33:54 · 3483 阅读 · 3 评论 -
【论文合集】Awesome Camouflaged Object Detection
A curated list of awesome resources for camouflaged/concealed object detection (COD).原创 2023-03-28 21:23:34 · 913 阅读 · 2 评论 -
【论文合集】Awesome Video Domain Adaptation
This repo is a comprehensive collection of awesome research (papers, codes, etc.) and other items about video domain adaptation.Domain adaptation has been a focus of research in transfer learning, enabling models to improve robustness which is crucial to a原创 2023-03-28 21:07:00 · 701 阅读 · 0 评论 -
深度学习入门Transformer
Transformer在许多的人工智能领域,如自然语言处理(Natural Language Processing, NLP)、计算机视觉(Computer Vision, CV)和语音处理(Speech Processing, SP)取得了巨大的成功。因此,自然而然的也吸引了许多工业界和学术界的研究人员的兴趣。到目前为止,已经提出了大量基于Transformer的相关工作和综述。本文基于邱锡鹏[1]老师团队近日所发表的一篇综述[2]为基础,详细的解读Transformer的来龙去脉,同时为大家介绍近期一些转载 2023-04-01 11:17:08 · 460 阅读 · 0 评论 -
深度学习中的各种注意力机制
视觉注意力机制是人类视觉所特有的一种大脑信号处理机制,而深度学习中的注意力机制正是借鉴了人类视觉的注意力思维方式。一般来说,人类在观察外界环境时会迅速的扫描全景,然后根据大脑信号的处理快速的锁定重点关注的目标区域,最终形成注意力焦点[1]。该机制可以帮助人类在有限的资源下,从大量无关背景区域中筛选出具有重要价值信息的目标区域,帮助人类更加高效的处理视觉信息。转载 2023-04-06 09:12:01 · 2654 阅读 · 0 评论 -
计算机视觉CV入门
计算机视觉,相对比自然语言处理这个领域来说入门门槛会稍微低些,而且图片视频相对于文字来说也更具有趣味性和易于理解。然而,这也会导致CV圈越来越卷,通过知乎相关热门问答便能体会到:2016年——深度学习的春天是不是要来了?2017年——人工智能是不是一个泡沫?2018年——算法岗是否值得进入?2019年——如何看待算法岗竞争激烈,供不应求?2020年——如何看待算法岗一片红海,诸神黄昏?2021年——如何看待算法岗灰飞烟灭?转载 2023-03-25 19:53:41 · 805 阅读 · 1 评论 -
深度学习中的各种数据增强
数据增强通常是依赖从现有数据生成新的数据样本来人为地增加数据量的过程。这包括对数据进行不同方向的扰动处理或使用深度学习模型在原始数据的潜在空间(latent space)中生成新数据点从而人为的扩充新的数据集。这里我们需要区分两个概念,即增强数据和合成数据:成数据:指在不使用真实世界图像的情况下人工生成数据,合成数据可由 GAN 或者现如今大火的 AGI 技术 Diffusion Model 产生;增强数据:从原始图像派生而来,并进行某种较小的几何变换(例如翻转、平移、旋转或添加噪声等)或者色转载 2023-03-25 13:10:06 · 814 阅读 · 0 评论 -
深度学习中的20种卷积
卷积,是卷积神经网络中最重要的组件之一。不同的卷积结构有着不一样的功能,但本质上都是用于提取特征。比如,在传统图像处理中,人们通过设定不同的算子来提取诸如边缘、水平、垂直等固定的特征。而在卷积神经网络中,仅需要随机初始化一个固定卷积核大小的滤波器,并通过诸如反向传播的技术来实现卷积核参数的自动更新即可。其中,浅层的滤波器对诸如点、线、面等底层特征比较敏感,深层的滤波器则可以用于提取更加抽象的高级语义特征,以完成从低级特征到高级特征的映射。本文将从背景、原理、特性及改进四个维度分别梳理10篇影响力深远的经典卷转载 2023-03-25 12:50:05 · 672 阅读 · 0 评论 -
深度学习中的各种池化方法
卷积神经网络(Convolution Neural Network, CNN)因其强大的特征提取能力而被广泛地应用到计算机视觉的各个领域,其中卷积层和池化层是组成CNN的两个主要部件。理论上来说,网络可以在不对原始输入图像执行降采样的操作,通过堆叠多个的卷积层来构建深度神经网络,如此一来便可以在保留更多空间细节信息的同时提取到更具有判别力的抽象特征。然而,考虑到计算机的算力瓶颈,通常都会引入池化层,来进一步地降低网络整体的计算代价,这是引入池化层最根本的目的。转载 2023-03-25 11:55:31 · 883 阅读 · 0 评论 -
深度学习中常见的回归损失和分类损失
损失函数是用于衡量模型所作出的预测离真实值(Ground Truth)之间的偏离程度。通常,我们都会最小化目标函数,最常用的算法便是“梯度下降法”(Gradient Descent)。俗话说,任何事情必然有它的两面性,因此,并没有一种万能的损失函数能够适用于所有的机器学习任务,所以在这里我们需要知道每一种损失函数的优点和局限性,才能更好的利用它们去解决实际的问题。损失函数大致可分为两种:回归损失(针对连续型变量)和分类损失(针对离散型变量)。转载 2023-03-25 10:10:51 · 1812 阅读 · 0 评论