深度学习
文章平均质量分 80
10生万物
内蒙古大学在读博士,研究兴趣为深度学习、机器学习、视频分析、智慧医疗、数学建模。累计发表论文7篇,主持或参与科研项目5项。获芙蓉学子-学术科研奖、研究生国家奖学金、区级优秀毕业生等荣誉。
展开
-
Github上git lfs oid sha256文件无法下载的解决方案
报错信息:magic_number = pickle_module.load(f, **pickle_load_args)_pickle.UnpicklingError: invalid load key, 'v'.文件信息:sha256加密下载链接原创 2023-08-15 09:25:07 · 11221 阅读 · 6 评论 -
pytorch bug汇总
pytorch日常报错汇总原创 2022-09-25 11:26:30 · 2533 阅读 · 1 评论 -
(论文总结)Temporal Pyramid Network for Action Recognition
一、大致介绍本文提取出了一个关注视频中动作快慢的网络,与SlowFast类似,但是SlowFast是将一个流分为两个帧率不同的分支最后再融合。而本文是结合了特征金字塔的思想来特征融合。二者有一定的区别,效果也再文中作出了对比。论文地址:2004.03548.pdf (arxiv.org)二、本文的结构2.1 背景文中举了一个例子:walking,jogging and running,三种行走的速率不同,如果统一处理的话会加大运算量,所以本文旨在研究如何更好的将不同动作速率的行为进行高效的特征.原创 2021-05-31 22:48:37 · 2454 阅读 · 0 评论 -
(论文总结)Video Transformer Network
论文地址:论文地址一、目前存在的问题及相应的改进1、3D卷积来提取时序特征的计算量问题**问题:**在视频任务下,传统卷积方法中为了更好的提取时序特征,一般采用3D的卷积方式,其中的计算量不管怎么改进也避免不了计算量大的问题。**改进:**文中使用最新的2D结构来提取空间信息,然后在结果特征上采用注意力机制来添加时序信息。此方法的输入只需要RGB视频帧流即可,不需要类似光流这样的其他流。2、针对长序列时序信息的提取**问题:**Transformers一开始用于具有连续性的语言模型上,在视频任.原创 2021-05-16 14:01:24 · 974 阅读 · 2 评论 -
(论文总结)SlowFast Networks for Video Recognition
SlowFast Networks for Video Recognition文章目录SlowFast Networks for Video Recognition一、传统的方法存在的问题1、没有将变化大和变化小的行为作出区分计算2、双流法的计算量和最后fc8的融合依旧是个问题二、本文的改进1、slow与fast两条路进行结合三、实验四、总结论文地址:论文官方代码:官方代码一、传统的方法存在的问题1、没有将变化大和变化小的行为作出区分计算(1)一个视频中的行为其实可以分为静态和动态的,一般认为做原创 2021-05-14 18:42:53 · 376 阅读 · 1 评论 -
(论文总结)SmallBigNet Integrating Core and Contextual Views for Video Classification
SmallBigNet: Integrating Core and Contextual Views for Video Classification[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bkcffHEX-1620830230231)(C:\Users\张plus\AppData\Roaming\Typora\typora-user-images\image-20210512170633032.png)]文章目录SmallBigNet: Integrating原创 2021-05-12 22:37:40 · 314 阅读 · 3 评论 -
(论文总结)Real-time Action Recognition with Enhanced Motion Vector CNNs
论文地址:https://arxiv.org/pdf/1604.07669.pdf代码地址:https://github.com/zbwglory/MV-release论文效果:基于双流网络,在精度保证损失很小的的情况下在UCF101上的FPS达到390.7(双流的FPS为14.3)要解决的核心问题:论文主要是基于双流网络来做的改进,双流网络有以下部分缺点:(1)光流(optical flow)占据的最大的运算量,并且由于运算量大,导致模型没有实时性,如下图为14.3...原创 2021-05-11 10:38:43 · 500 阅读 · 0 评论 -
(论文总结)Compressed Video Action Recognition
代码地址:https://github.com/chaoyuaw/pytorch-coviar一、摘要首先,深度神经网络尽管在图像任务中表现出了非常好的效果,但是在视频任务中由于存在时序问题,它有时候并不能发挥出最好的作用。传统的双流法采用光流来提取视频帧之间的运动差异信息,但是是针对整个视频来提取的,但是这里有个问题,视频在传输和读取的过程中占据了非常大的内存,只有通过编码(H264)将原始视频先压缩成IBP帧,降低视频大小(通常可以将200多g的视频压缩为1g的文件),用的时候再根据I...原创 2021-05-10 16:11:43 · 559 阅读 · 0 评论 -
Anaconda的安装以及深度学习Pytorch的安装教程
一、安装Anaconda1、简介Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。2、要求:文件大小:根据不同的版本(32/64)大小不同所需空间大小:2-4GB3、下载:(官网下载):很慢,不推荐官网地址:https://www.anaconda.com/(清华镜像下载):很好用,下载速度很快https://mirrors.tuna..原创 2020-11-06 15:21:32 · 827 阅读 · 1 评论 -
目标检测之R-CNN(一)
原创 2020-11-01 22:09:05 · 153 阅读 · 1 评论 -
统计学习方法——支持向量机(SVM) 递推式学习笔记(手写)完
原创 2020-10-26 16:57:42 · 182 阅读 · 1 评论 -
VGG中1*1的卷积核相比于全连接层的好处及原因
原创 2020-10-24 10:50:33 · 1259 阅读 · 0 评论 -
Alexnet网络相比于基本神经网络的改进(思维导图&手写笔记)
本文主要是对AlexNet网络模型的基本构成的分析笔记,五层卷积+池化+标准化以及三层全连接层暂不作笔记。只记下前五层输出特征图像的计算过程。 传统网络模型的一些显而易见的问题:AlexNet模型相比于普通神经网络模型的优势:参考链接:1、https://www.cnblogs.com/wangguchangqing/p/10333370.html2、https://aistudio.ba...原创 2020-10-23 23:01:08 · 1154 阅读 · 0 评论 -
百度飞浆深度学习_卷积神经网络(思维导图手写笔记)(1:理论部分)
原创 2020-10-22 09:31:26 · 281 阅读 · 1 评论 -
Deep Learning from Scratch(深度学习入门鱼书)手写总结(一)
原创 2020-10-21 22:24:30 · 1417 阅读 · 0 评论