论文框架流程_3

A Robust Multi-Athlete Tracking Algorithm by Exploiting Discriminant Features and Long-Term Dependencies

问题描述:追踪视频中的运动员,背景为运动赛事解说和分析;
场景特点:人员固定,人员活动频繁,人员活动的速度比较固定,同队人员外观十分相似,队内不同角色的姿势有较大不同;

论文主要内容:

  1. 将Pose信息融入外观、运动和交互的评分;
  2. 利用AlphaPose的方法,针对关节进行比对,减少噪音影响和遮挡;
    整体框架:

PTSN

  1. Pose-based Appearance stream(PAS)
    在这里插入图片描述
    由AlphaPose得到姿势特征,实验使用32维向量;外观特征由ResNet提取,实验使用32维向量;姿势特征和外观特征融合为64维向量,作为LSTM的输入;
    输入运动员i在1~t时刻的特征信息,与运动员j在t+1时刻的特征对比,LSTM输出到一个Softmax层,得到PAS相似性系数;

  2. Posed-based Motion stream(PMS)
    在这里插入图片描述
    在这里插入图片描述
    AlphaPose提取姿势特征后传入运动提取器,根据上式计算16个关节点的速度信息,速度信息是关节点相对移动的距离,(x,y)为平面坐标;16个关节点如下图所示:在这里插入图片描述

  3. Posed-based Interaction stream(PIS)
    假设前提:辨认一个运动员不仅要靠他自己的特征,还要考虑他周围人的信息;
    措施:考虑目标对象周围3个运动员的相对信息;
    在Interaction Grid (IG)交互网格上标出目标与周围最靠近的三个运动员的交互特征;考虑6个关键节点:头、左手腕、左脚腕、右手腕、右脚腕、中心点,如下图:在这里插入图片描述
    在这里插入图片描述
    IG网格计算方式(t时刻运动员i):在这里插入图片描述

  4. 平均PAS、PMS、PIS即得到最后融合的分数;

算法描述

其中Cactive存储迄今追踪到的tracklets,Cdie存储没用的,Cfinal存储最后输出的,Clost存储没有匹配的;
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值