面向零样本学习的人体行为识别深度网络模型

最新推荐文章于 2024-06-15 09:49:12 发布

瀚岳-诸葛弩

最新推荐文章于 2024-06-15 09:49:12 发布

阅读量731

点赞数 4

文章标签：学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011616825/article/details/130294136

版权

应该是这辈子最后一篇人体行为检测方面的论文了，以后可能走中医望诊方面的研究道路。也算是5年来的一个总结了。发明专利已下，论文还在无休止的修改、重投当中，能中个2区就谢天谢地了。

深度神经网络总图如下，是一个端到端的模型：

主要步骤：

1、通过卷积神经网络识别人体的基本动作，并通过自研的TAL技术（在上一篇论文中提出了一种探进式的temporal action localization算法），提取视频中基本动作的持续时间，并在时序维度进行排序组合。完成“视频-->文字”的转化；

2、将动作词通过word2vec进行量化，结合第1步提取的时间构建一个小尺度的浮点矩阵。并构建一个多尺度浅层神经网络进行行为识别

3、在模型训练方面，通过词语组合进行训练，实现了0视频样本的模型训练目的。

结果不是太好，但对于没有真实视频样本的情况来说，还是可圈可点，模型训练耗时非常少（10个epoch可完成模型训练，几乎是瞬间），同时准确率也达到了71.43%

创新点：

1、通过动作组合，在语义层对人体行为进行描述；

2、将视频识别转变为语义相似度问题；

3、通过两个神经网络，构建了一个端到端的零样本人体行为识别模型。

瀚岳-诸葛弩

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。