面向零样本学习的人体行为识别深度网络模型

应该是这辈子最后一篇人体行为检测方面的论文了,以后可能走中医望诊方面的研究道路。也算是5年来的一个总结了。发明专利已下,论文还在无休止的修改、重投当中,能中个2区就谢天谢地了。

深度神经网络总图如下,是一个端到端的模型:

 主要步骤:

1、通过卷积神经网络识别人体的基本动作,并通过自研的TAL技术(在上一篇论文中提出了一种探进式的temporal action localization算法),提取视频中基本动作的持续时间,并在时序维度进行排序组合。完成“视频-->文字”的转化;

2、将动作词通过word2vec进行量化,结合第1步提取的时间构建一个小尺度的浮点矩阵。并构建一个多尺度浅层神经网络进行行为识别

3、在模型训练方面,通过词语组合进行训练,实现了0视频样本的模型训练目的。

结果不是太好,但对于没有真实视频样本的情况来说,还是可圈可点,模型训练耗时非常少(10个epoch可完成模型训练,几乎是瞬间),同时准确率也达到了71.43%

 创新点:

1、通过动作组合,在语义层对人体行为进行描述;

2、将视频识别转变为语义相似度问题;

3、通过两个神经网络,构建了一个端到端的零样本人体行为识别模型。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值