深度学习
文章平均质量分 50
Taboo-
这个作者很懒,什么都没留下…
展开
-
光流融合到RGB流的巨作:《MARS: Motion-Augmented RGB Stream for Action Recognition》
光流融合到RGB流的巨作:《MARS: Motion-Augmented RGB Stream for Action Recognition》原创 2023-01-02 18:57:42 · 942 阅读 · 0 评论 -
深度学习(pytorch)经常使用的一些小技巧
1 可视化模型结构以及每一层的shape和参数量。安装 torchinfo 包pip install torchinfo -i https://pypi.tuna.tsinghua.edu.cn/simple写代码 from torchinfo import summary base_model = uniformer_small() print(summary(base_model, (1, 3, 8, 224, 224)))...原创 2022-05-21 17:17:50 · 223 阅读 · 0 评论 -
加载pytorch已有模型,修改最后分类头
加载pytorch已有模型 修改分类头原创 2022-04-11 19:52:51 · 2118 阅读 · 0 评论 -
注意力机制(Attention)
注意力机制想要理解注意力机制,先看一下Encoder RNN(Seq2Seq Model)是怎么一回事。Seq2Seq Model中有一个编码器也就是下面这张图所展示的,比如要将一段英文翻译成中文,编码器就是将每一个词向量XiXiXi进行矩阵变换,变换之后的结果为 hihihi,编码器将这些词向量的特征汇聚到最后一个状态 hmhmhm上,也就是说经过 EncoderEncoderEncoder 编码器之后,我们得到的只有 hmhmhm ,之前的 h 都会舍去。我们再来看解码器,它像我们文本生成器一样原创 2021-11-27 19:12:02 · 2138 阅读 · 0 评论 -
行为识别论文笔记 Mobile Video Action Recogition
Mobile Video Action Recogition 这篇论文是将行为识别搭建到手机上的构想,提出了用MobileNetV2来作主干网络,TTP融合I帧,MV(特征向量),残差。 [论文链接](https://arxiv.org/abs/1908.10155)Abstract有关视频的行为识别一直是计算机视觉和视频分析的经典问题,目的是为了将一个短视频来预测出它的类别,例如:爬楼梯,剪头发。最近在行为识别的工作是围绕着深度神经网络来做,也取得了相当优秀的成绩。尽管手机的计算速度在快速发展,但原创 2021-11-22 19:42:02 · 1497 阅读 · 0 评论 -
FlowNet的网络解码过程
很多小伙伴对于FlowNet的网络解码过程很懵,所以这里手画了一个解码的流程图,供大家理解。这样做的目的是为了网络能够获得深层的抽象信息,同时还可以获得浅层的具象信息。原创 2021-10-18 21:33:33 · 172 阅读 · 0 评论