自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 在occluded Person Re-ID中,选择clip还是ViT作为backbone?

CLIP是OpenAI提出的一种模型,旨在通过对大规模的图像和文本数据进行对比学习,实现图像和文本的相互理解。CLIP模型包含了一个图像编码器和一个文本编码器,通过对比学习(contrastive learning)方法训练,使得图像和文本在同一个向量空间中能够很好地对应。

2024-07-28 14:52:35 627

原创 深度学习中的backbone,neck和head是什么?

Backbone:提取输入图像的特征(如 VGG、ResNet)。Neck:对特征进行进一步处理和融合(如 FPN、PANet)。Head:根据具体任务生成最终的预测结果(如分类头、检测头、分割头)。这三个部分紧密结合,组成了一个完整的深度学习模型,每个部分的设计和选择都会影响模型的性能和适用场景。

2024-07-25 15:04:02 1155

原创 Person Re-Identification(Re-ID)的分类

整体行人重识别是最基础和标准的行人重识别任务。其假设行人在图像中的全身是清晰可见的,没有被遮挡或部分缺失。目标是通过行人的全身图像来进行识别。局部行人重识别指在图像中只有行人的部分可见,而非整个身体。这种情况常见于行人被部分遮挡、图像裁剪或行人位于图像边缘等情况。遮挡行人重识别是指行人在图像中被其他物体或行人部分遮挡的情况。这种情况在现实场景中非常常见,如行人被树木、车辆或其他行人挡住。整体行人重识别、局部行人重识别和遮挡行人重识别是行人重识别任务中的不同场景。

2024-07-23 14:40:19 629

原创 生成对抗网络(Generative Adversarial Networks GANs)

对GAN进行详细的介绍。

2024-07-18 14:29:01 957 1

原创 如何理解深度学习中的 metric learning(度量学习)?

Metric learning(度量学习)是机器学习和深度学习中的一个领域,其目标是通过学习一个映射函数,将数据点映射到一个新的空间中,使得在该空间中,相似的数据点距离较近,而不相似的数据点距离较远。度量学习广泛应用于图像检索、人脸识别、语音识别等任务。

2024-07-16 13:40:36 793

原创 如何理解Embedding?

Embedding是一种强大的技术,它通过将离散的、高维的数据转换为连续的、低维的向量,使得模型能够更有效地处理这些数据。通过学习得到的嵌入向量能够捕捉到数据之间的复杂关系和相似性,从而在各种任务,尤其是自然语言处理任务中,发挥重要作用。

2024-07-10 14:31:59 511

原创 RE-ID中的CMC、mAP、recall、precision、ACC

mAP更好地反映了所有正确的目标图片在排序列表顶部的程度。与CMC曲线相比,它可以更全面地衡量Re-ID算法的性能,它反映了模型在单一类别上的工作效果,是每个正确预测的准确率的平均值。它反映了输出中正确样本的准确性。

2024-07-02 13:49:00 250 1

原创 计算机专业前沿知识框架

2024-04-19 17:49:55 195

原创 计算机考研复试面试常问问题--数据库篇

2024-04-19 17:46:14 257

原创 计算机考研复试面试常问问题---操作系统篇

2024-04-18 14:14:29 330

原创 计算机考研复试面试常问问题--编程语言篇

2024-04-18 14:12:19 172

原创 计算机考研复试(面试)--操作系统

2024-04-17 21:24:35 453

原创 计算机考研复试(面试)-计算机组成原理

2024-04-17 21:23:26 319

原创 计算机考研复试(面试)--计算机网络

2024-04-16 09:50:36 493

原创 计算机考研复试(面试)----数据结构

考研面试数据结构常见问题汇总

2024-04-16 09:47:21 386

原创 ​​计算机考研常见问题(面试)--408+数据库

408+数据库面试常见问题

2024-04-15 10:58:53 275 1

原创 LSTM(长短期记忆)

遗忘门在LSTM中的作用是通过控制细胞状态中的记忆,选择性地遗忘不必要的信息,处理长期依赖关系,动态调整网络的记忆状态,以及减少梯度消失问题,从而提高了网络对时间序列数据的学习和记忆能力。这有助于网络更好地学习和记忆关键模式和特征。4. 适应不同时间步的输入:输入门根据每个时间步的输入数据动态调整,这使得LSTM网络能够灵活地适应不同时间步的输入模式和特征,提高了网络的泛化。输出门在LSTM中的作用是控制细胞状态对隐藏状态的输出程度,处理长期依赖关系,动态调整网络的输出状态,以及产生最终的预测或输出结果。

2024-04-14 10:49:41 1904

原创 VMD(变分模态分解)

VMD,全称是变分模态分解,是一种用来分离非固定频率信号的方法。其原理源于信号处理中的固定频率信号大小不固定的问题。②在任意点,由局部最大值定义的信号包络线和由局部最小值定义的信号包络线的均值为零。VMD是一个非线性和自适应的过程,它利用一种迭代过程,通过将数据分解为更简单的、频率固定的信号,然后进行合并和过滤,从而实现信号的高质量重建。3.通过对解调信号梯度的L2正则化进行高斯 平滑估计,得到每个光伏分量的带宽。2.通过混合一个调至各自估计中心频率的指 数,将各光伏分量的频谱转移到基带区域。

2024-04-14 10:43:08 1847

原创 编译原理-计算机考研面试(复试)问题---个人总结2

实现多态时,根据对象的实际类型查找其对应的虚函数表,然后调用相应的虚函数,这个过程可能在编译时完成,也可能在运行时完成。** 答案:优化是编译流程的一个步骤,其目的在于改进编译器产生的代码,使得改进后的代码消耗更少的资源,如运行更快或占用更少的内存空间。** 答案:指令调度是编译器中的代码生成阶段的一个环节,目的是重排一组指令的执行顺序,来避免处理器流水线的停顿,并提高执行效率。** 答案:符号表是编译器用来收集关于源程序的语义信息的数据结构,如变量名、函数名、常量名等,以及它们的类型,范围,内存位置等。

2024-03-26 10:16:30 985 1

原创 计算机考研复试---编译原理(部分)--仅用于我自学

静态多态(编译时多态)是在编译时确定函数的调用地址,通过函数的名称和参数类型来选择正确的函数。编译器在编译阶段根据参数的类型和数量来确定要调用的函数,这种多态性是在编译时静态决定的。答案:前端优化是指在源代码级别上进行的优化,包括对算法和数据结构的改进,而后端优化是在生成的中间代码或目标代码上进行的优化,包括指令选择、寄存器分配和代码调度等。答案:遮蔽指的是在作用域中使用同名标识符来隐藏外部作用域中的标识符,而同名覆盖是在继承的情况下,在派生类中使用与基类中相同名称的成员函数或变量来覆盖基类的成员。

2024-03-20 21:59:00 599 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除