总体感觉课程很难,不像是扫盲课程,太多的概念都不清楚,听的云里雾里的,只听懂了前面一点点,后面的完全没懂。。。。。。
什么是人体姿态估计
从给定的图像中识别人脸、手部、身体等关键点
输入: 图像 1
输出:所有关键点的像素坐标
2D人体姿态估计
在图像上定位人体关键点(通常为人体主要关节)的坐标
基本思路: 基于回归
将关键点检测问题建模成一个回归问题,让模型直接回归关键点的坐标
深度模型直接回归坐标有些困难,精度不是最优
基本思路: 基于热力图
并不直接回归关键点的坐标,而是预测关键点位于每个位置的概率,
热力图可以基于原始关键点坐标生成,作为训练网络的监督信息
网络预测的热力图也可以通过求极大值等方法得到关键点的坐标
模型预测热力图比直接回归坐标相对容易,模型精度相对更高,因此主流算法更多基于热力图但预测热力图的计算消耗大于直接回归
多人姿态估计: 自顶向下方法
step 1.使用目标检测算法检测出每个人体
Step 2.基于单人图像估计每个人的姿态