人体姿态估计——IEF

最新推荐文章于 2022-11-09 16:23:13 发布

Huntersts

最新推荐文章于 2022-11-09 16:23:13 发布

阅读量713

点赞数

文章标签：神经网络

本文链接：https://blog.csdn.net/qq_35260390/article/details/104508271

版权

本文介绍了人体姿态估计的一种新框架——交互式误差反馈（IEF）。通过学习多级特征提取器，结合前馈模型和反馈机制，IEF能够逐步修正关节位置的预测。在每个循环中，模型通过预测修正值优化当前输出，最终逼近真实值。使用预训练的卷积网络，如GoogLeNet，调整以适应17个关节的特征提取，并以2D修正值进行训练。在实验中，模型展示出良好的姿态估计性能。

摘要由CSDN通过智能技术生成

人体姿态估计

1.Introduction

主要贡献是提供了一个通用的框架，概况建在关节空间上通过学习多级的特征提取器来描述输入和输出空间中的丰富的结构。通过合并top-down反馈来实现这个框架，在反馈过程中，循环地预测当前估计的错误之处并且进行修正。这个框架被称为IEF。

在IEF中，前馈模型 $f$ 作用于被增强过的输入空间上，通过将RGB图像 $I$ 和估计得到的结果 $y_t$ 的视觉特征 $g$ 连接在一起来预测“修正的值（ $ε_t$ ）”，这样可以使 $y_t$ 更接近真实值 $y$ 。修正值（ $ε_t$ ）被用到当前的输出上 $y_t$ 来得到 $y_{t+1}$ 并且通过 $g$ 转换成视觉特征, 接下来被和图像叠加到一起得到新的 $f$ 的输入 $x_{t+1}=I⊕g(y_t)$ ，然后如此循环下去。这个过程使用输出值 $y_0$ 的猜测值初始化，并且重复至达到预先确定的值时结束。在每个循环中模型被训练到正确的范围内，使用一个范围值来调节 $y_t$ 的原因是因为 $x_t$ 空间是典型的高度非线性空间而且定位修正值应该比较容易学习到。模型可以用下面的公式描述：
$ε_t = f(x_t)$ $y_{t+1}=y_t+ε_t$