Temporal Relational Reasoning in Videos

Temporal Relational Reasoning in Videos

框架

TRN

TRN(Temporal Relation Networks)

公式:
T 2 ( V ) = h ϕ ( ∑ i &lt; j g θ ( f i , f j ) ) T_{2}(V)=h_{\phi}\left(\sum_{i&lt;j} g_{\theta}\left(f_{i}, f_{j}\right)\right) T2(V)=hϕ(i<jgθ(fi,fj))

T 3 ( V ) = h ϕ ′ ( ∑ i &lt; j &lt; k g θ ′ ( f i , f j , f k ) ) T_{3}(V)=h_{\phi}^{\prime}\left(\sum_{i&lt;j&lt;k} g_{\theta}^{\prime}\left(f_{i}, f_{j}, f_{k}\right)\right) T3(V)=hϕi<j<kgθ(fi,fj,fk)

T 4 ( V ) = h ϕ ′ ( ∑ i &lt; j &lt; k &lt; l g θ ′ ( f i , f j , f k , f l ) ) T_{4}(V)=h_{\phi}^{\prime}\left(\sum_{i&lt;j&lt;k&lt;l} g_{\theta}^{\prime}\left(f_{i}, f_{j}, f_{k}, f_{l}\right)\right) T4(V)=hϕi<j<k<lgθ(fi,fj,fk,fl)

Multi-Scale Temporal Relations

M T N ( V ) = T 2 ( V ) + T 3 ( V ) … + T N ( V ) M T_{N}(V)=T_{2}(V)+T_{3}(V) \ldots+T_{N}(V) MTN(V)=T2(V)+T3(V)+TN(V)

优点

文章指出,TRN的强大之处在于能够解释视频常识,这个是优于C3D和I3D(后续会介绍,常用算法)的地方:

  1. 视频中具有代表性的画面有利于TRN识别一个活动;
  2. 对于同一类视频,具有很好的适用性;
  3. 对行为识别来说,TRN的时序性很重要,尤其是单方向的动作;
  4. 能够在动作的早期完成识别。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值