自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

fy_326983的博客

原创 Convolutional Two-Stream Network Fusion for Video Action Recognition论文笔记

第二篇论文读书笔记该篇论文发现了双流网络的两个缺点：(i)是不能在空间和时间特征之间学习像素级的对应关系(因为融合只是分类的分数上)；(ii)有限时间规模，因为空间卷积操作只在单帧上，时序卷积操作只在堆叠的L个时序相邻的光流帧上（例如L=10）。在视频中，双流的实现通过在规则的空间采样上使用时间池在一定程度上解决了后一个问题，但这并不允许对行为的时间演变进行建模。该文章通篇谈的是融合(Fusion)，关键阐释的是如何去融合空域卷积网络与时域卷积网络、在哪里融合这两个网络、如何在时域上融合网络三个问题

2020-11-21 18:10:27 892 3

翻译译：Convolutional Two-Stream Network Fusion for Video Action Recognition

这是双流神经网络的改进版，接下来会出他的读书笔记。摘要：近年来，卷积神经网络（卷积神经网络）对视频中人类行为识别的应用提出了不同的解决方案，用于整合外观和运动信息。为了更好地利用时空信息，我们研究了许多在空间和时间上融合卷积塔的方法。我们得出以下结论：（i）空间和时间网络不在Softmax层融合，而是可以在一个卷积层融合，既不会损失性能，而且在参数上有大量的节省;（ii）最好在最后一个卷积层而不是之前的层上（spatially）融合，而在类预测层上的融合可以提高精度;最后（iii）将...

2020-11-10 20:13:47 1589

原创 Two-Stream Convolutional Networks for Action Recognition in Videos读书笔记

看完这篇文献已经好多天了，重新梳理一下双流Conv网络的读书笔记。仅个人见解，望大家指正交流。行为识别是计算机视觉中一个非常重要的方向，无论是科学研究领域还是工业控制领域，都有极高的实用价值，对交通服务以及社交领域都有着极大的推动作用，在学习行为识别的过程当中，遇到了一系列的问题，比如如何在静态的图像和动态的过程之间捕获一种连接性的信息，让两者可以很好地联系起来。这篇文献对这个问题提出了一个很好的见解，介绍了一种双流卷积网络，来实现视频中的行为识别。Character...

2020-11-06 10:03:31 492

翻译译：Two-stream convolutional networks for action recognition in videos

该篇文章为视频识别十分经典的一篇论文也是入门文章，开创了比较经典的双流（时间流+空间流）神经网络，本人发现很多大神博主翻译的论文不是特别完整，故按照原文与个人理解整理完整翻译见下。摘要：我们研究了用于训练视频中行为识别的深度卷积网络架构。这个挑战是捕捉静态帧中的外观和连续帧间的运动的互补信息。我们也旨在推广这个在数据驱动的学习框架中表现得最好的手工特征。本文一共做出了3个贡献：首先，本文一个包含空间和时间网络的双流ConvNet体系结构。其次，我们验证了，尽管是有限的训练...

2020-10-20 14:24:10 1973 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除