自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 CV领域常用词及其含义

CV领域常用词及其含义一、backbone二、head三、neck四、bottleneck五、GAP六、embedding七、pretext task和downstream task八、warm up九、end to end一、backbone在神经网络中,尤其是CV领域,一般先对图像进行特征提取(常见的有vggnet,resnet,inception等等),这一部分是整个CV任务的根基,因为后续的下游任务都是基于提取出来的图像特征去做文章(比如分类,生成等等)。所以将这一部分网络结构称为backbon

2022-05-16 21:03:17 2177 1

原创 Transformer万字详解

Vision Transformer一、Transformer起源(李宏毅)1.self-attention一、Transformer起源(李宏毅)1.self-attention现实中有很多情况需要把a set of vectors(may change length)作为输入,比如一段英文“this is a cat”,可以把其进行one-hot encoding(独热编码)也可以对其进行word embedding(给每个词一个向量,这个向量有语义的信息,比如说把word embedding画出

2022-05-16 16:53:34 1072

原创 RoI Pooling 和 RoI Align

RoI Pooling 和 RoI Align一、基本概念一、基本概念RoI(Region of Interest)是通过不同区域选择方法,从原始图像(original image)得到的候选区域(proposal region)

2022-04-28 20:44:41 5015 2

原创 LSTM和GRU看完必须全部了然

LSTM和GRU的感性理解一、RNN的缺点——短时记忆二、LSTM1.整体结构一、RNN的缺点——短时记忆RNN 会受到短时记忆的影响。如果一条序列足够长,那它们将很难将信息从较早的时间步传送到后面的时间步。 因此,如果你正在尝试处理一段文本进行预测,RNN 可能从一开始就会遗漏重要信息。在反向传播期间,RNN 会面临梯度消失的问题。 梯度是用于更新神经网络的权重值,消失的梯度问题是当梯度随着时间的推移传播时梯度下降,如果梯度值变得非常小,就不会继续学习。因此,在递归神经网络中,获得小梯度更新的层

2022-04-08 20:39:49 1124

原创 如何写一篇优质论文

阅读笔记一、如何写论文1.整体行文思想(1)列出提纲和实现计划(2)格式要排好(3)用reviewer的视角去写文章2.每个部分应该怎么写(1)给文章取个好名字(2)摘要和关键词(3)引言(4)材料与方法(5)实验结果3.具体写作语言(1)学术写作常用词组与句式(2)SCI写作常用句式总结二、整体行文逻辑1.writing is first2.identify your key idea3.tell a story4.nail your contributions to the mast(Introduct

2022-04-08 10:35:15 1306

原创 linux下的各种小问题们

开个新的文档,linux(ubuntu)中遇到的各种小问题都放到这里面1.怎么启动没有pycharm快捷键的pycharm进入pycharm安装路径下的bin目录下,找到pycharm.sh文件,然后打开终端,输入命令:./pycharm.sh

2022-03-08 16:09:38 860

原创 PPDM原文阅读笔记

目录一、概述二、详细说明1.传统HOI检测简介2.PPDM简介(1)提出了新的一阶段HOI监测框架(2)建立了一个更加偏向应用的HOI-A数据集3.PPDM详细介绍(1)总体流程图(2)点检测分支<1>定义变量<2>计算point location loss<3>计算size and offset loss(3)点匹配分支<1>定义变量<2>计算displacement loss<3>Triplet matching(4)Loss an

2021-12-10 15:49:30 3920 3

原创 在Colab上复现TSN

目录一、Colab简介和使用说明1.Colab简介2.Colab使用说明2.1两种使用方式2.1.1连接谷歌云盘2.1.2不连接谷歌云盘2.2具体使用细节2.2.1GPU设置2.2.2程序管理2.2.3具体编程二、TSN代码复现1.数据集准备和处理1.1数据集下载1.2数据集处理一、Colab简介和使用说明1.Colab简介colab是谷歌的一个线上深度学习训练平台,对于刚进实验室还没分配到工作站的研究生非常之友好。但是分配到工作站以后,不管是算力还是金钱还是方便程度,还是工作站香。网址: http

2021-11-12 15:53:05 1978 1

原创 ResNet原文阅读笔记

文章目录一、ResNet解决的问题一、ResNet解决的问题按常人思维来看,深的深度学习网络虽然会,应该越深性能越好,然而这几个作者却发现事实并不是那么简单。如下图所示,不管是在训练集还是测试集,56层深的网络都比20层深的网络训练结果差。...

2021-11-04 21:17:00 1595

转载 解决Chrome搜索时报错ERR_EMPTY_RESPONSE(自用)

以管理员身份打开cmd依次输入ipconfig /releaseipconfig /allipconfig /flushdnsipconfig /renewnetsh int ip set dnsnetsh winsock reset然后重启电脑就OK了

2021-11-02 19:55:41 2578

原创 python补充学习(未完成)

目录一、类基础1.初始化类2.实例属性13.实例属性24.类属性5.实例方法6.私有属性7.私有方法8.@classmethod方法19.@classmethod方法210.staticmethod方法11.property112.property213.类的继承14.子类方法的重构15.子类与父类的关系16.多态二、TSN补充学习0.argparse模块1.argparse模块12.argparse模块23.argparse模块34.argparse模块45.argparse模块56.argparse模块

2021-10-29 15:04:51 290

原创 TSN源码阅读

目录一、项目结构1.py文件解释2.函数组成及调用关系3.IPO图二、opts.py解读三、main.py解读四、models.py解读五、dataset.py解读瞎写八写在前第一次读代码,读了快一周了还是迷离迷糊的,不知道从哪读起,也不知道怎么debug,python学的感觉也用不到,用到的都是没学的。慢慢来把,争取下一周读完+能在工作站上跑一下UCF-101的数据集。上周日看了Randy教授的最后一课,感触最深的一段话是他说的遇到困难时候的态度,以前读到这种感觉就是鸡汤一看而过,当真正开始遇到这种

2021-10-29 15:03:43 2541 7

原创 TSN原文阅读笔记

文章目录一、补充知识1.Optical Flow2.two-stream(RGB图和光流混合起来判断)的缺点二、TSN介绍1.TSN大体模型介绍2.五种共识聚合函数(1)max pooling(2)average pooling(3)top-k pooling(4)weighted average(5)attention weighting3.四种不同输入4.三种改进训练的策略(1)交叉输入模式预训练(2)正则化技术(3)数据增强5.M-TWI(1)长视频分类的挑战(2)M-TWI方法五、优点与不足1.优点

2021-10-22 16:17:15 1570

原创 two-stream双流网络 知乎、CSDN学习笔记

文章目录一、文章解决的问题二、论文细节1.双流网络的具体结构是什么2.两个网络怎么合并在一起3.optical flow(光流)是什么4.多任务学习怎么做5.Bi-directional optical flow(双向光流)6.优点和不足一、文章解决的问题1.提出了two-stream结构的CNN,由空间和时间两个维度的网络组成2.使用多帧的稠密光流场作为训练输入,可以提取动作的信息3.利用了多任务学习的方法把两个数据集联合起来二、论文细节1.双流网络的具体结构是什么该网络有两个独立的识别流

2021-10-22 16:07:39 7867

原创 动作识别概况

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-10-22 15:58:32 9783

原创 CNN按钮报告

CNN按钮报告一、 不同激活函数对精度和Loss的影响两层卷积一层池化一层全连接(1)Relu:最终Loss为1.389(2)Sigmoid:最终Loss为4.851(3)Tanh:最终Loss为4.046(4)总结:Loss AccRelu 1.389 0.581Sigmoid 4.851 0.050Tanh 4.046 0.069可以看出在较为简单的网络模型中,使用relu作为激活函数,其效果与其他两个激活函数比起来是非常好的,而其他两种函数可能由于问题复杂且模型简单,效果都非

2021-10-15 18:44:10 653

原创 梯度下降算法实现code

2021-09-24 21:15:45 89

原创 处理多维特征输入code

2021-09-24 21:13:36 102

原创 多分类问题简单实现code

2021-09-24 21:11:58 222

原创 CNN简单实现code

2021-09-24 21:10:31 203

原创 听课笔记对应code(后四章)

一、第五章broadcasting第六章合并与分割二、第七章矩阵的运算三、第八章属性统计

2021-09-24 21:07:00 76

原创 听课笔记对应code(前四章)

一、第一章PyTorch数据类型代码二、第二章创建Tensor三、第三章索引与切片四、第四章维度变换

2021-09-24 20:59:18 92

原创 Pytorch听课笔记

一、pytorch数据类型1.pytorch数据类型Pytorch数据类型(CPU上的):torch.IntTensor,torch.FloatTensor,torch.ByteTensor(比较两种类型用)Pytorch数据类型(GPU上的):torch.cuda.IntTensor,torch.cuda.FloatTensor,torch.cuda.ByteTensor(比较两种类型用)表示string的话一般常用独热法(让结果与数值和string无关)2.Type check(类型检验,常用

2021-09-24 16:42:14 605

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除