自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(316)
  • 资源 (9)
  • 问答 (1)
  • 收藏
  • 关注

原创 变化检测(Change Detection,CD) 综述2篇 & CD代码 & 常用CD数据集及链接

CD best paper 。综述1,介绍变化检测流程、各种类型的CD数据集、分析不同的算法框架与当前AI主流网络,实际应用,机遇与挑战(无监督、异构数据、是否可靠),内容丰富。综述2,包括,遥感领域中变化检测的应用,深度学习算法概述(历史、deep models、DBNs、SAEs、CNNs),已有的CD相关论文的汇集整理分析和涉及的期刊会议,大致分为三组(有监督、无监督CD、迁移学习),有前途的研究方向(强化学习、弱监督学习)。对比之下,综述2适合简单的入门科普,综述1更为深刻,值得细读。

2022-11-22 10:10:21 11577 5

原创 Matlab 常用快捷键

Matlab 常用快捷键 & Matlab 常用函数与python对照表

2022-11-13 14:53:35 5681

原创 【综述】Transformers in Remote Sensing: A Survey

第一次系统地审查在遥感中基于变压器的最新进展。我们的调查涵盖了60多种最新的基于变压器的方法,用于遥感领域的不同遥感问题:甚高分辨率(VHR)、高光谱(HSI)和合成孔径雷达(SAR)图像。我们通过讨论变压器在遥感方面的不同挑战和开放问题来结束调查。

2022-11-04 00:38:42 3348 2

原创 ubuntu常用命令

ubuntu常用命令行,记录下来。

2022-10-31 11:42:15 820

原创 近年 计算机视觉 会议 论文 网站

2021年和2022年的顶会论文与代码分享,包括有ECCV2022,CVPR2022,CVPR2021,ICCV2021,推荐系统相关(ACL、SIGIR、NeurIPS、RecSys、KDD、CIKM、WWW、IJCAI)

2022-10-16 21:13:25 1144

原创 github资源收藏地

不定期更新,收集整理的github资源,有关CV各个方向(异常检测、语义分割、医学图像、Transformer、attention、yolo系列)、算法、就业、论文、cv资源、摄影。

2022-10-05 20:44:02 2689

原创 计算机视觉 (CV) 相关的会议或期刊投稿时间

计算机视觉领域中的CCF会议及期刊介绍汇总。

2022-01-12 20:16:54 4931

原创 计算机视觉会议&期刊

介绍一些关于计算机视觉领域的会议和期刊!

2022-01-12 20:03:03 4690 1

原创 【论文笔记】利用扩散模型DDPM做变化检测change detection

去噪扩散模型DDPM去年开始在各种视觉任务取得惊人的效果,变化检测领域也不例外,本文介绍两篇关于如何使用扩散模型实现变化检测的论文。第一篇做法较为自然,先利用遥感数据预训练DDPM,然后将预训练好的网络当作变化检测任务的特征提取器;第二篇则更有意思,不再进行像素分类,而是直接利用扩散模型生成变化图。

2024-05-12 23:25:56 1216 1

原创 【NeurIPS 2023】PromptIR: Prompting for All-in-One Blind Image Restoration

图像恢复是从其受损版本中恢复高质量清晰图像的过程。deep-learning方法显著提升了图像恢复性能,然而,它们在不同类型和级别的退化上的泛化能力有限。这限制了它们在实际应用中的使用,因为需要针对每种具体的退化进行单独训练模型,并了解输入图像的退化类型才能应用相应的模型。本文介绍了一种基于提示的学习方法,称为PromptIR,用于全能图像恢复,可以有效地从各种类型和级别的退化中恢复图像。具体而言,本文方法使用提示来编码退化特定信息,并动态引导恢复网络。

2023-12-02 17:34:36 1266 2

原创 【IJCAI2022】Uncertainty-Guided Pixel Contrastive Learning for Semi-Supervised Medical Image Segmentat

论文将对比学习引入半监督分割,并提出了一种新的不确定性引导的半监督医学图像分割像素对比学习方法。具体来说,为每个未标记的图像构建一个不确定性图,然后重新移动不确定性图中的不确定性区域,以降低噪声采样的可能性。不确定性图由精心设计的一致性学习机制确定,该机制通过鼓励来自两个不同解码器的一致性网络输出来生成对未标记数据的全面预测。此外,论文认为由图像编码器学习的有效全局表示对于不同的几何变换应该是等变的,于是构造了一个等变对比损失来增强编码器的全局表示学习能力。

2023-11-26 18:10:59 929

原创 【半监督学习】CNN与Transformer的结合

​本文介绍了几篇结合使用CNN和Transformer进行半监督学习的论文,CNN&Trans(MIDL2022),Semi-ViT(ECCV2022),Semiformer(ECCV2022)。

2023-11-19 20:01:53 2945

原创 【TGRS 2023】RingMo-Sense: Remote Sensing Foundation Model for Spatiotemporal Prediction via Spatiotem

遥感时空预测旨在从视频和时间序列图像等历史时空数据中推断未来趋势,在许多领域具有广泛的应用前景。基础模型由于其强大的特征提取能力,是时空信息挖掘的一个很有前途的研究方向,在自然场景中取得了快速的进展。然而,由于遥感数据的空间多尺度和时间多尺度特性,这些方法在应用于遥感时仍然会遇到瓶颈。因此,论文提出了一种基于时空演化去模糊的时空预测遥感基础模型,简称RingMo-Sense。考虑到空间亲和性、时间连续性和时空相互作用,论文构建了空间、时间和时空三分支预测网络。

2023-11-11 23:54:24 1220

原创 【ICCV 2023】EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction

高分辨率密集预测得到越来越多的应用,如计算摄影、自动驾驶等。然而,巨大的计算成本使得在硬件设备上部署最先进的高分辨率密集预报模型变得困难。本文提出EfficientViT,一个新的高分辨率视觉模型家族,具有新颖的多尺度线性特性。不同于现有的高分辨率密集预测模型依赖于大量的softmax注意力、硬件低效的大内核卷积或复杂的拓扑结构来获得良好的性能,多尺度线性注意力只需轻量级和硬件高效的操作就可以实现全局感受野和多尺度学习(高分辨率密集预测的两个理想特征)。

2023-11-02 20:30:49 2752 1

原创 【TGRS 2023】RingMo: A Remote Sensing Foundation ModelWith Masked Image Modeling

深度学习方法促进了遥感 (RS) 图像解释的快速发展。最广泛使用的是利用ImageNet预训练模型来处理指定任务的 RS 数据。然而,存在自然场景与RS场景之间的领域差距,以及 RS模型泛化能力差 等问题。开发具有通用 RS 特征表示的基础模型是有意义的。由于有大量未标记的数据可用,自监督方法在遥感方面比全监督方法具有更大的发展意义。然而,目前大多数自监督方法都使用 对比学习,其性能对数据增强、附加信息以及正负对的选择很敏感。本文利用。

2023-10-25 22:09:18 2342

原创 【综述】Diffusion Models: A Comprehensive Survey of Methods and Applications

论文:github:Conditional Image Generation (Image Super Resolution, Inpainting, Translation, Manipulation)

2023-10-19 21:57:57 2426

转载 【论文合集】Awesome Diffusion Models 3

介绍使用diffusion来实现多模态学习、3D视觉、对抗攻击,以及语音领域的生成、增强等任务。

2023-10-17 15:52:27 17932

转载 【论文合集】Awesome Diffusion Models 2

介绍diffusion做生成、分类、分割、图像翻译、医学图像的论文。来源:https://github.com/diff-usion/Awesome-Diffusion-Models

2023-10-17 12:56:41 6025

转载 【论文合集】Awesome Diffusion Models 1

介绍关于diffusino的各种资源和综述论文。

2023-10-16 22:13:30 1911

原创 ubuntu修改IP地址

面对ubuntu18以上的版本,主要有两种界面:图形化界面和纯命令行界面。图形化界面配置比较简单,命令行配置稍许复杂,但方便。

2023-10-14 13:20:23 19909

原创 【CVPR 2023】 All are Worth Words: A ViT Backbone for Diffusion Models

文中首次使用U-Net建模score-based model (即diffusion model),后续DDPMADMImagen等许多工作对U-Net进行了一系列改进。目前,绝大多数扩散概率模型的论文依然使用U-Net作为主干网络。ViT在各种视觉任务中显示出了前景,而基于CNN的U-Net在扩散模型中仍然占主导地位。论文设计了一种简单通用的基于ViT的架构(命名为U-ViT),用于使用扩散模型生成图像。

2023-10-10 21:55:10 2474

原创 【论文合集】Awesome Video Diffusion

A curated list of recent diffusion models for video generation, editing, restoration, understanding, nerf, etc.

2023-10-07 15:08:45 2444

原创 【NeurIPS 2023】Backdoor对抗攻防论文汇总

2023年以及2022年的NeurIPS有关backdoor的对抗攻防的论文。

2023-10-05 13:00:44 4817

原创 【arXiv2309】RingMo-lite: A Remote Sensing Multi-taskLightweight Network with CNN-TransformerHybrid Fr

近年来,RingMo的遥感(RS)视觉基础模型在各种下游任务中取得了优异的性能。然而,对计算资源的高需求限制了这些模型在边缘设备上的应用。有必要设计一个更轻量级的基础模型来支持在轨遥感图像解释。现有方法在实现轻量级解决方案的同时在RS图像解释中保持通用性方面面临挑战。这是由于RS图像中复杂的高频和低频频谱分量,使得传统的单一CNN或视觉变换器方法不适合该任务。因此,本文提出了RingMo-lite,一个具有CNN-Transformer混合框架的RS多任务轻量级网络,它有效地利用了RS的频域特性。

2023-10-04 15:03:31 2756

转载 【NeurIPS 2023】Toward Understanding Generative Data Augmentation

生成式数据扩增通过条件生成模型生成新样本来扩展数据集,从而提高各种学习任务的分类性能。然而,很少有人从理论上研究生成数据增强的效果。为了填补这一空白,论文在这种非独立同分布环境下构建了基于稳定性的通用泛化误差界。基于通用的泛化界,论文进一步了探究了高斯混合模型和生成对抗网络的学习情况。在这两种情况下,论文证明了,虽然生成式数据增强并不能享受更快的学习率,但当训练集较小时,它可以在一个常数的水平上提高学习保证,这在发生过拟合时是非常重要的。

2023-10-03 16:34:24 2585

原创 【CVPR 2023】EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention

Vision Transformer由于其高度的建模能力而取得了巨大的成功。然而,它们的卓越性能伴随着沉重的计算代价,不适合于实时应用。本文提出了一个高速ViT,即EfficientViT。论文发现,现有的Transformer模型的速度通常受到访存效率低的操作的限制,尤其是在MHSA中的张量重塑和逐元素函数。因此,论文设计了一种新的三明治布局的构建块,即在有效的FFN层之间使用单个内存受限的MHSA,在增强通道通信的同时提高了访存效率。此外,注意力图在头部之间有很高的相似性,导致计算冗余。

2023-10-03 11:15:27 4669 1

原创 【推荐系统】多任务学习模型

介绍一些多任务学习模型了解是如何处理多任务分支的。如ESSM,MMoE,PLE,DSSM,GateNet,GemNN。

2023-10-03 09:24:52 3135

原创 【轻量化网络】MobileNet系列

论文:https://arxiv.org/abs/1704.04861代码:解读:【图像分类】2017-MobileNetV1 CVPR_說詤榢的博客-CSDN博客 论文:https://arxiv.org/abs/1801.04381代码:https://github.com/d-li14/mobilenetv2.pytorch解读:【图像分类】2018-MobileNetV2_[18]sandler m,howard a,zhu m,et al. mobilenetv2: i_說詤榢的博客-CSDN博客

2023-09-09 16:25:23 2680

原创 【ICCV2023】Robustifying Token Attention for Vision Transformers

Vision Transformer在图像分类等任务中表现出色,但在面对常见的图像扰动(如噪声或模糊)时,其性能会显著下降。为此,论文对ViT的关键组成部分——自注意力机制进行研究分析,发现当前的视觉transformer模型在自注意力机制中存在"token overfocusing"的问题,即注意力机制过度依赖于少数重要token。然而这些token对图像扰动非常敏感。Token-aware Average Pooling(TAP)和Attention Diversification Loss(ADL)

2023-08-28 22:33:24 2768

原创 【ECCV2022】Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation

文如题名,本文使用纯Transformer构建Unet网络,用于医学图像分割。本文用Swin Transformer替换Unet全部结构,构建出Swin-UNet。

2023-08-22 21:04:49 3325

原创 【ICCV2021】Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions

PVT 把金字塔结构引入到Transformer中,使其可以无缝接入各种下游任务。简单调整Multi-Head Attention,提出spatial reduction attention。本文仿照CNNs中常见的金字塔结构,改进原始的Transformer,划分多个stage,每个stage的长宽减半,通道维度增加,再把多个stage进行叠加。以应用于分类、检测、分割等任务。

2023-08-22 19:36:47 2771

原创 【ICCV2023】Adaptive Frequency Filters As Efficient Global Token Mixers

最近的vision transformer、大核CNN和MLP由于其在全局范围内的有效信息融合,在视觉任务中取得了显著的成功。然而,由于自注意机制、大内核或全连接层的高昂计算成本,它们的高效部署,特别是在移动设备上的高效部署仍然面临着值得注意的挑战。这项工作,将传统的卷积定理应用于深度学习,以解决这一问题,并揭示自适应频率滤波器可以作为有效的全局令牌混频器。基于此,论文提出了自适应频率滤波(AFF)令牌混频器:Adaptive Frequency Filtering token mixer。

2023-08-21 10:10:34 3225 2

原创 【论文综述】Transformer 综述

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述_中科院AI算法工程师的博客-CSDN博客Transformer综述大全(1)【A Survey of Visual Transformers】_香博士的博客-CSDN博客Transformer综述大全(2)【A Survey of Visual Transformers】_香博士的博客-CSDN博客_transformer综述[Transformer]A Survey on Vision Transformer_黄小米吖的博客.

2023-08-18 22:04:28 2571

原创 【图像分类】CNN + Transformer 结合系列.4

​介绍两篇利用Transformer做图像分类的论文:CoAtNet(NeurIPS2021),ConvMixer(ICLR2022)。CoAtNet结合CNN和Transformer的优点进行改进,ConvMixer则patch的角度来说明划分patch有助于分类。​

2023-08-09 16:23:26 6125

原创 【arXiv2306】CrossKD: Cross-Head Knowledge Distillation for Dense Object Detection

知识蒸馏(KD)已被验证为一种有效的学习压缩对象检测器的模型压缩技术。现有的最先进的目标检测KD方法大多基于特征模拟,通常观察到这比预测模拟更好。本文发现,GT信号和蒸馏目标之间的优化目标不一致是预测模拟效率低下的关键原因。为了缓解这个问题,论文提出一种简单而有效的蒸馏机制 CrossKD,它将学生模型检测头的中间特征传递给教师模型检测头,并强制使交叉头的预测与教师模型的预测保持一致。

2023-08-05 20:07:37 3209 3

原创 SAM(Segment Anything)大模型论文汇总

SAM大模型论文汇总

2023-08-01 21:02:42 5063

原创 【图像分类】CNN+Transformer结合系列.3

​​介绍两篇图像分类的论文:ResMLP(arXiv2305),MetaFormer(CVPR2022),两者都与Transformer有关系,前者基于transformer结构的特点设计ResMLP,后者认为宏观架构才是Transformer成功的原因并设计一个简单的PoolFormer结构。​​

2023-07-31 13:17:35 6123

原创 【图像分类】CNN+Transformer结合系列.2

​介绍几篇利用CNN+Transformer实现图像分类的论文:CMT(CVPR2022),MaxViT(ECCV2022),MaxViT(ECCV2022),MPViT(CVPR2022)。主要是说明Transformer的局限性,然后利用CNN的优势去弥补和结合。​

2023-07-28 17:42:01 6946

原创 【arXiv2306】1M parameters are enough? A lightweight CNN-based model for medical image segmentation

卷积神经网络(CNNs)和基于Transformer的模型由于能够提取图像的高级特征和捕捉图像的重要方面而被广泛应用于医学图像分割。然而,在对高精度的需求和对低计算成本的期望之间往往存在权衡。具有更高参数的模型理论上可以获得更好的性能,但也会导致更高的计算复杂性和更高的内存使用率,因此实现起来并不实用。本文寻找一种轻量级的基于U-Net的模型,它可以保持不变,甚至实现更好的性能,即U-Lite。基于深度可分离卷积的原理设计了U-Lite,既可以利用细胞神经网络的强度,又可以减少大量的计算参数。

2023-07-25 19:44:21 3341

原创 【ICCV2023】ARS-DETR: Aspect Ratio Sensitive Oriented Object Detection with Transformer

现有的目标检测方法通常使用度量AP50来度量模型的性能。论文认为AP50的角度偏差公差较大,本质上不适合旋转目标检测。因此,论文提倡使用高精度度量,如AP75,来衡量模型的性能。(论文的检测器在AP75上效果比较好,在AP50上效果不行)本文提出了基于Transformer的高宽比敏感的旋转目标探测器,称为ARS-DETR,它在高精度面向目标检测中具有竞争力的性能。提出了一种新的角度分类方法,称为高宽比感知圆光滑标签(AR-CSL),以更合理的方式平滑角度标签,并丢弃之前工作中引入的超参数(如CSL)。

2023-07-25 16:25:10 3565

中国计算机学会推荐国际学术会议和期刊目录-2022

中国计算机学会推荐国际学术会议和期刊目录-2022

2022-12-01

中国计算机学会推荐国际学术会议和期刊目录-2019

中国计算机学会推荐国际学术会议和期刊目录-2019

2022-11-01

深度学习+计算机视觉+语义分割+综述

深度学习+计算机视觉+语义分割+综述,包含各类若监督语义分割模型,介绍、总结、可能的发展方向。

2022-10-22

机器学习深度学习+特征选择+Feature Selection

机器学习深度学习+特征选择+Feature Selection

2022-10-17

运用K-Means算法挖掘高价值B站up主.docx

大数据挖掘课程作业。提出一种利用聚类和分类等数据技术来挖掘B站中具有高价值的up主。通过挖掘B站up主的视频播放信息,能够获得其点赞量、播放量、留言反馈等各种信息。基于这些信息对up主进行聚类,讲up主分为不同价值的群体。文中主要使用K-Means聚类算法来对B站up主群体进行分类,从而反映出不同up主的价值,并以此为依据来推送有高价值的up主,于平台、于用户而言都是有益的。实验结果显示,该方法展现出很好的分类效果。

2022-01-03

基于YOLOv5的道路裂缝检测.docx

人工智能导论课的课程作业。随着交通路面的飞机数量急剧上升,安全驾驶被广泛关注,能否及时检测到机场跑道路面是否存在裂缝成为一项安全技术。文章阐述Yolov5的工作原理,对道路裂缝进行网络建模以及训练后获取预测的结果,采用公式(均精度和平均召回率)对其进行评估,对已有标签的数据进行预处理,整理获得相关的训练集和测试集。试验表明基于Yolov5的交通路面裂缝检测满足人们对准确性和实用性的需求。

2022-01-03

基于HOG特征与SVM算法的图像分类 .docx

人工智能导论课作业,像分类,指在给定的类别中,选出与该图像匹配的类别作为输入的图像处理方法。支持向量机(SVM)是一种以统计学习理论为基础的用来解决二分类问题的机器学习方法。SVM是结构风险最小化模型,较好的解决了数量较小时过拟合问题,能有效提高模型的泛化能力。在解决小样本、非线性及高维模式识别问题中,表现出许多特有的优势。本次实验使用的是自己提出的一个关于路面裂缝的crack数据集,为提升实验效果,先提取图像HOG特征,再利用SVM来进行分类训练,以识别图片中是否存在裂缝。本文设计了完整的HOG+SVM识别算法,使用自己提出的crack数据集进行了实验测试。

2022-01-03

《航空大数据》的大数据作业.docx

《航空大数据导论》作业,包括有大数据基本术语、常用工具、挖掘技术,以及大数据应用案例分析

2022-01-03

基于QAR数据聚类分析的航班异常检测.docx

提出一种基于聚类分析与主成分分析的方法,以解决检测异常飞行、识别未知安全隐患等问题。借助该方法可应用聚类技术对QAR数据进行分析,以检测具有独特数据模式的异常飞行,其中QAR数据是快速存取记录器的简称,是一种用于监控、记录大量飞行参数的飞行数据记录仪。与现有的方法相比,该方法无需预定义标准。

2022-01-03

基于深度学习的多尺度目标检测方法综述.doc

课程综述论文,内容主要来源于发表于软件学报上的《多尺度目标检测的深度学习研究综述》,选取了部分内容,并附上参考文献首页截图。

2022-01-03

多尺度目标检测的深度学习研究综述.pdf

主要介绍了多尺度目标检测的方式,包括有图像金字塔、网络内特征金字塔、以及锚点、动态卷积等等1.

2022-01-03

A Survey of Visual Transformers 2021.pdf

A Survey of Visual Transformers 2021.pdf

2021-11-29

SOTR Segmenting Objects with Transformers.pdf

SOTR Segmenting Objects with Transformers.pdf

2021-11-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除