自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 学习笔记(十)Faster R-CNN论文

*ROl pooling :**负责收集proposal 并且计算proposal feature maps ,两个输入(最开始CNN提取的初始feature map 和RPN刚刚生成的Proposal)因为全连接成需要一致的输入特征,这里的proposal大小不同,传统的crop即裁剪会损失完整的结构信息,wrap会破坏图像原始形状,所以使用Rol poling。(4)这样处理后,即使大小不同的proposal输出结果都是pooled_w x pooled_h固定大小,实现了固定长度输出。

2023-10-25 13:23:48 40 1

原创 学习笔记 (九) Fast R-CNN论文

再将池化后的向量拉长,并且作为F层的输入,同时输出两个值,一为softmax(即每一类的概率),二为bounding box 回归(即R-CNN中的预测框)最后对输出的得分矩阵使用非极大抑制方法选出少数框,对每一个框选择概率最大的类作为标注的类,根据网络结构的第二个输出,选择对应类下的位置和大小对图像进行标注。然后把一整张图片放入到卷积网络中进行特征提取(此处和R-CNN不同,R-CNN是将2k个候选框中的图像放入其中),获得其特征图,析:主要解决了R-CNN的一些问题。所谈对象:Fast R-CNN。

2023-10-20 20:35:55 47 1

原创 学习笔记(八)R-CNN

对于在图片中定位目标,本文采用在候选区域识别的方法,步骤:首先在输入图片上生成大约2000个与目标类别无关的候选区域,然后在每一个候选区域上用CNN提取出固定长度的特征向量,我们用仿射变换从每一个候选区域中计算固定大小 CNN,而不管候选区域的大小,最后用线性SVM对每一个候选区域进行分类。本文的第二个贡献是首先在辅助数据集(ILSVRC)上用有监督的预训练,然后用特定领域的小数据集(PASCAL)进行微调,当数据量很少的时候,这种方式可以有效地训练高精度的CNN。②用少量的带标签数据集来训练模型。

2023-10-16 21:21:53 48 1

原创 学习笔记(七)A Comprehensive Study of Deep Video Action Recognition综述笔记

零样本动作识别:它的目标是将学习到的知识转移到以前未见过的类别中,它们大多遵循一个标准的框架,即首先使用预先训练好的网络从视频中提取视觉特征,然后训练一个联合模型,将视觉嵌入映射到语义嵌入空间。基于轨迹的方法:TDD(一种基于轨迹约束的汇集算法,将深层卷积特征聚合成有效的描述符,轨迹被定义为在时间维度中跟踪像素的路径)、将独立子空间分析(ISA)和密集轨迹结合到标准的双流网络中,展示了数据无关和数据驱动两种方法的互补性。这里,I帧是原始RGB视频帧,P帧和B帧包括用于存储差值的运动矢量和残差。

2023-10-15 21:48:19 77 1

原创 学习笔记(六)A Comprehensive Study of Deep Video Action Recognition综述笔记

文章思路:介绍视频动作识别——解析17个关于数据集——主要挑战——从手工制作的特征到CNN——使用双流网络——3DCNN——高效的视频建模方法——Miscellaneous 杂项(轨迹、秩池化、压缩视频、帧剪辑采样、视频节奏)——模型的评估方案和具体数据集比较——未来方向(数据增强、视频域自适应DA、神经结构搜索、发展基于2D卷积的高效网络体系结构、新数据集、视频的对抗训练、零样本动作识别、弱监督视频动作识别、自我为中心的行为识别、多模态、自监督视频表示学习)对象:视频的动作识别。

2023-10-13 21:33:35 100

原创 学习笔记(五)

记:周三、周四课程较多,以上课为主。周三主要完成了英语基本任务,综述开始看了一点,周四要加快速度。

2023-10-12 21:25:28 27

原创 学习笔记(四)

把test部分的代码敲了一下,对其中的思路还是更加清晰,近似于昨日的train部分,但是不要忘记要使其不做梯度运算(即不做计算图)记:今日以上课为主【英语写作、数值、机器学习】、单词背了、准备在每日英语任务中加入二十分钟口语、浅学深度学习。接昨天的代码总结,然后看综述。

2023-10-10 21:00:19 36

原创 学习笔记(三)——菜鸟,勿嘲

第一种(分不同文件)训练函数:1、进入训练状态 2、可以设置指令函数,tqdm(,) 3、定义损失函数和梯度优化函数(此处放在训练函数内)4、用for循环计算,for step, data in enumerate(): 5、梯度清零——训练——计损——反向传播——更新——统计。代码两种不同的写法,但总结来说还是离不开几大步骤:准备数据集(预处理,导入(知道不同数据的路径,返回),完成网络模型的架构(有些预训练模型可以直接引用),定义损失函数,如何训练,最后是main。

2023-10-09 21:42:26 36 1

原创 学习笔记(二)

记:昨日调休上课,没有学习,但是理了理后续如何学习和安排。

2023-10-08 16:28:56 54 1

原创 个人笔记---深度学习方向研究生

(定位视频中的存在行为动作的视频段+分类)localization+recognition。②边界不明确(不同于动作识别,动作检测需要精确的动作区间检测,边界的不确定导致mpa偏低)主要思路:Temporal Proposal提取,然后进行分类和回归。研究难点:①时序信息(基本使用RNN读入+CNN提取或者C3D)③时间跨度大,一个行为的时间不等,提取proposal艰难。action detection(行为(动作)检测)技术原理:类似与目标检测,均需要先定位目标,然后识别。

2023-10-06 19:47:15 49

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除