lbs的核心技术都有哪些?_【星球知识卡片】视频分类与行为识别有哪些核心技术，对其进行长期深入学习...

最新推荐文章于 2020-11-26 14:55:14 发布

weixin_39567013

最新推荐文章于 2020-11-26 14:55:14 发布

阅读量141

点赞数

文章标签： lbs的核心技术都有哪些?

大家好，欢迎来到我们的星球知识小卡片专栏，本期给大家分享视频分类的核心技术点。

作者&编辑 | 言有三

1 3D卷积

视频相对于图像多出了一个维度，而3D卷积正好可以用于处理这个维度，因此也非常适合视频分类任务，不过缺点是计算量比较大，下图展示了一个简单的3D模型。

2 RNN与LSTM

视频和语音信号都是时序信号，而RNN和LSTM正是处理时序信号的模型，也是早期用于视频分类的重要模型。

3 双流法

视频中的目标往往是运动的，因此光流也是非常重要的信息。双流法包含两个通道，一个是RGB图像通道，用于建模空间信息。一个是光流通道，用于建模时序信息。两者联合训练，并进行信息融合。

4 光流预测模型

由于双流模型是当前视频分类的主流模型，而其中光流信息对结果影响很大，因此光流预测模型至关重要，尤其是轻量级的光流预测模型非常值得研究。

5 多框架融合

Two-Stream网络和3D网络各有优点，都可以很好的建模时序关系，但是计算量巨大，因此有的框架致力于融合两类框架，并降低计算量。

6 其他

总的来说，视频分类和行为识别有非常多的研究方向，包括：

(1) 三维卷积的改进。

(2) 光流提取模型的改进。

(3) RGB和光流特征的融合改进。

(4) 多模态信息融合。

(5) 多标签视频分类。

(6) 更加细粒度的动作分类。

(7) 更长程信息的捕获。

(8) 行为定位。

(9) 视频标注。

以上内容，如果你不想自己学习，可以去我们知识星球的网络结构1000变板块—视频分类板块阅读。

有三AI知识星球

知识星球是有三AI的付费内容社区，里面包括各领域的模型学习，数据集下载，公众号的付费图文原稿，技术总结PPT和视频，知识问答，书籍下载，项目推荐，线下活动等资源，了解详细请阅读以下文章：

【杂谈】有三AI知识星球一周年了！为什么公众号+星球才是完整的？

【杂谈】万万没想到，有三还有个保密的‘朋友圈’，那里面都在弄啥！

星球知识卡片：

【星球知识卡片】残差网络家族10多个变种学习卡片，请收下！

【星球知识卡片】移动端高效率的分组网络都发展到什么程度了？

【星球知识卡片】注意力机制发展如何了，如何学习它在各类任务中的应用？

【星球知识卡片】模型剪枝有哪些关键技术，如何对其进行长期深入学习

【星球知识卡片】模型量化的核心技术点有哪些，如何对其进行长期深入学习

【星球知识卡片】模型蒸馏的核心技术点有哪些，如何对其进行长期深入学习

【星球知识卡片】视频分类与行为识别有哪些核心技术，对其进行长期深入学习

weixin_39567013

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lbs的核心技术都有哪些?_【星球知识卡片】视频分类与行为识别有哪些核心技术，对其进行长期深入学习...

大家好，欢迎来到我们的星球知识小卡片专栏，本期给大家分享视频分类的核心技术点。作者&编辑 | 言有三1 3D卷积视频相对于图像多出了一个维度，而3D卷积正好可以用于处理这个维度，因此也非常适合视频分类任务，不过缺点是计算量比较大，下图展示了一个简单的3D模型。2 RNN与LSTM视频和语音信号都是时序信号，而RNN和LSTM正是处理时序信号的模型，也是早期用于视频分类的重要模型。3 双流法...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。