自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 收藏
  • 关注

原创 跨模态、多模态、多任务之间的区别与联系

跨模态是指从一种模态的数据中学习,并将其知识应用到另一种模态的数据上。跨模态学习可以利用不同模态数据之间的隐含关系,从而提高模型的泛化能力。从图像数据学习,用于文本生成。从文本数据学习,用于图像生成。从语音数据学习,用于唇语识别。跨模态、多模态和多任务是人工智能领域中相互关联的概念,它们可以相互促进,共同推动人工智能技术的进步。

2024-04-22 13:42:21 262 2

原创 深度学习常见回归分支算法逐步分析,各种回归之间的优缺点,适用场景,举例演示

回归的概念:回归算法是一种用于预测连续数值输出的监督学习算法,可以根据输入特征预测一个或多个目标变量。它有多个分支,每个分支都有其独特的优缺点。

2023-12-02 22:21:12 1524

原创 深度学习今年来经典模型优缺点总结,包括卷积、循环卷积、Transformer、LSTM、GANs等

最后,再介绍一种人工神经网络:前馈神经网络(Feedforward Neural Networks,FNNs)。将一种语言的文本翻译为另一种语言。适用场景:用于序列数据处理,与 LSTM 类似。将图像分类为不同的物体或场景。案例:股票价格预测。适用场景:用于自然语言处理、机器翻译等。将口头语言转换为文本。适用场景:用于生成图像、音频、文本等。将图像分为不同的类别。适用场景:序列建模、自然语言处理等。适用场景:处理长序列和时间序列数据。适用场景:图像分类、目标检测等。适用场景:用于分类和回归任务。

2023-12-01 15:58:51 1356

原创 ground truth 在深度学习任务中代表的是什么意思?

总的来说,“ground truth” 是模型训练和评估过程中的基准标准,也是评估模型性能和准确度的关键指标。通过它,可以直接间接评估模型的性能。

2023-11-29 09:58:23 2702

原创 解决 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized的问题

意思是要初始化一个libiomp5md.dll文件,但是发现这个文件已被初始化了。

2023-11-28 15:02:21 1889

原创 深度学习常见激活函数:ReLU,sigmoid,Tanh,softmax,Leaky ReLU,PReLU,ELU整理集合,应用场景选择

近年来常用激活函数集合,拒绝知识角落盲点

2023-11-22 11:18:18 1163

原创 LanguageBind: extending video-language pretraining to n-modality by languagebased semantic alignment

的多模态预训练方法,但它是通过间接对齐到图像的方式实现的,不适用于与语言模态的对齐,可能导致性能下降。(1)提出了基于语言的多模态预训练框架 LanguageBind,在预训练过程中通过对比学习将其他模态与语言模态对齐,并且这些模态在一个共享的嵌入空间内统一。的模态不可知编码器,保持权重矩阵 W0 不变,同时学习一个新的权重矩阵 BA。第一步是生成搜索词数据库,设计一种独特的搜索词获取策略,利用来自各种视觉任务数据集的文本数据,包括标签和标题,以构建具有丰富视觉概念和多样性的视频数据集。

2023-11-15 16:55:14 369

原创 清华镜像源地址,适用于pip下载速度过慢从而导致下载失败的问题

注意,如果你开了科学上网的梯子,记得关掉,否则会出现proxy error报错,清华镜像源和梯子不能同时开!代表的是你将要下载的包名称。

2023-11-14 14:36:28 255

原创 Progressive Attribute Embedding for Accurate Cross-modality Person Re-ID—效果可以说是领域最强的一篇文章

属性加图像信息进行融合提取特征

2023-10-24 22:03:56 181

原创 OneDrive打不开了,怎么办?使用管理员身份也无效,分享解决办法如下

one 软件打不开的解决办法

2023-10-18 22:05:59 2878

原创 Xshell7试用期过了,打开就显示评估期已过,想继续或者不能删除怎么办?详细说明解决步骤

使用Xshell软件遇到的的一些问题

2023-10-17 21:48:42 5811 1

原创 Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Bench

论文学习

2023-10-17 15:31:17 189 2

原创 Linux 发展史

介绍一下 linux 的发展历史

2023-10-17 11:04:18 81

原创 Self-Supervised Modality-Aware Multiple Granularity Pre-Training for RGB-Infrared Person Re-ID—通用范式

作者提出了一种自监督的预训练方案,模态感知多粒度学习(MMGL),它仅在多模态 ReID 数据集上从头开始直接训练模型,但在不使用任何外部数据或复杂的调整技巧的情况下,与 ImageNet 预训练相比,可以获得有竞争力的结果。来表示随机混洗的图像补丁序列的排序向量,该模块旨在学习用置换矩阵 P 重建其原始序列 O ,在数学上,P 属于 0-1 双随机矩阵的集合,其中第 i 行和第 j 列中的每个非零元素都表明当前第 i 个补丁应该分配到序列的第 j 位(可以理解为 P 是用来进行转置的矩阵)。

2023-08-20 10:52:18 142

原创 Learning Progressive Modality-shared Transformers for Effective Visible-Infrared Person Re-id

在本文中,我们提出了一种新的基于深度学习的框架PMT,该框架通过充分挖掘可靠的模态变量特征,有效地提高了VI ReID的性能。以灰度图像作为辅助模态,我们的框架通过渐进学习策略缓解了RGB-IR模态之间的巨大差距。同时,我们提出的MSEL和DCL可以有效地提取更可靠和更具判别力的特征,带来更强的性能和鲁棒性。此外,所提出的方法具有很好的推广性。通过将我们的方法应用于基于CNN的主干网,它们也可以带来显著的性能改进。在两个公共VI ReID基准上的实验结果验证了我们提出的框架的有效性。

2023-07-11 21:47:36 474

原创 关于我向国内作者发邮件要数据集的这件事,记录一下

找一个顶刊作者要数据集

2023-06-07 10:34:55 4729 5

原创 Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification

假设体型信息和身份相关的模态共享信息(虚线框表示)部分重叠。为了使提取的特征更加多样化,我们提出了形状擦除特征学习范式,将表征分解为形状相关特征和形状擦除特征。学习形状擦除特征驱动模型发现除身体形状之外更丰富的模态共享语义概念。

2023-06-06 19:53:31 1054

原创 Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for V-I Re-ID:如何有效利用生成嵌入?

生成嵌入的引用,结合于自注意力机制。

2023-06-06 17:15:04 1255 8

原创 电脑无论是连接热点,还是公共网络,qq、微信都能用,就是不能上网,现分享解决办法如下。

电脑不能上网的情况,原因是端口被占用了。

2023-04-25 10:16:09 3472 2

原创 网络工程师—下午题准备,一些常用的练习命令,现分享给大家一起学习

ensp虚拟机练习华为命令,备考23网络工程师。

2023-04-14 21:51:31 1084

原创 Cross-Modality Transformer for Visible-Infrared Person Re-Identification—跨模态的另一开篇之作,思想借鉴了以往研究,并作出改进

跨模态行人重识别的新研究方向

2023-04-09 20:12:35 1063

原创 subprocess.CalledProcessError: Command ‘[‘/public/home/***/anaconda3/bin/python‘, ‘-u‘, ‘./tool

遇到的问题

2023-04-07 22:15:08 1297

原创 【python】ModuleNotFoundError: No module named ‘mmseg‘ 或者 ModuleNotFoundError: No module named ‘mmcv’

依赖包安装的问题

2023-04-07 20:20:34 2783

原创 华为模拟器Ensp,virtualbox安装步骤,抓包软件的安装—网络工程师必备软件

为了准备软考所安装的模拟器软件,安装过程中的问题都已经给大家详细列举出来了,希望能够帮助到大家

2023-04-06 09:17:39 2706 2

原创 关于Surface系列重装系统的操作方法,出现的问题并给出了解决办法。

surface go 重装系统遇到的问题,包括重装系统,恢复安装原厂自带office,调整时间

2023-04-05 15:59:18 7636 6

原创 TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE—Vision Transformer(ViT)论文详解

vision transformer详细分析,会时常更新一些自己对transformer的理解。

2023-03-29 11:29:44 460

原创 EDTER: Edge Detection with Transformer—边缘检测,效果远超之前的研究

基于Transformer的边缘检测,可以精读研究

2023-03-25 21:58:28 2155 2

原创 Homogeneous and Heterogeneous Relational Graph for Visible-infrared Person Re-identification——基线结果很好

一篇精度很高的文章,baseline质量还不错。

2023-03-23 21:39:54 326

原创 23年最新版pycharm找不到conda可执行文件解决办法

最新版pycharm找不到conda可执行文件解决办法

2023-03-09 08:22:32 49897 96

原创 计算机专业研究方向相关论文查找方法,分享给大家,实测有用。

论文文献查找的方法合集

2023-03-08 08:32:10 3171

原创 CMTR: Cross-modality Transformer for Visible-infrared Person Re-identification

跨模态行人重识别,一种挑战传统学习方法的研究方法。

2023-03-03 19:56:44 802 2

原创 NFormer: Robust Person Re-identification with Neighbor Transformer—基于Transformer的研究,注意公式简化过程,降低计算成本

行人重识别的新式应用。

2023-02-28 21:01:51 582

原创 TransReID: Transformer-based Object Re-Identification—一篇媲美CNN学习框架

基于Transformer框架的行人重识别,衍生了新的研究方法

2023-02-26 19:30:59 853 1

原创 Vue的使用+学习,保姆级手册

近期我会学习关于Vue2.0跟Vue3.0,现分享学习笔记,供大家有效的学习,特别是小张同学,要好好学习哦。如有问题,联系本人。

2023-02-22 20:11:06 733 1

原创 什么是Resnet50模型?

主流网络:Resnet50

2023-02-18 20:30:47 6247

原创 Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences

Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences

2023-02-13 21:41:20 337

原创 Dual-granularity feature fusion network for cross-modality person re- identification—利用轮廓信息进行特征融合

双粒度特征融合网络的跨模态行人再识别,一篇质量还不错的中文论文,通过对轮廓特征的加深使用,全局粗粒度融合和局部细粒度融合的结合使用,精确度还算取得了不错的精确度。

2023-02-12 22:59:43 394

原创 Syncretic Modality Collaborative Learning for Visible Infrared Person Re-Identification—建立融合模态,三模态共享

Syncretic Modality Collaborative Learning for Visible Infrared PersonRe-Identification,一种简单的框架图,主要是通过融合模态进行共享学习,对融合模态进行了适当的控制,与通道增强学习可以做对比。ran-k为67%。

2023-02-10 23:41:19 573

原创 跨膜态行人重识别 综述,查阅许多资料,详细解释,适合以前没有基础的同学学习。

跨膜态行人重识别综述,未来研究方向

2023-02-08 22:40:26 2812

原创 Cross-Modality Person Re-Identification via Modality-Aware Collaborative Ensemble Learning—新颖的改进网络框架

Cross-Modality Person Re-Identification via Modality-aware ECollaborativensemble Learning,叶芒老师的一篇具有新颖文章

2023-02-07 21:02:40 301

python的apex的小包,解决Pycharm爆红

python的apex的小包,解决Pycharm爆红

2022-11-09

RegDB数据集.zip

RegDB数据集包含412个身份的8240个图像,其中206个身份用于训练,其余用于测试。每个身份有10个IR和10个RGB图像。

2022-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除