B站:https://www.bilibili.com/video/BV1ky4y1s76X?spm_id_from=333.999.0.0
人体姿态估计方法分类
- Top-Down
pipeline:图片 -> 检测器 -> 多个行人 -> for person in detected persons,单独做关键点检测
优点:精度高
缺点:计算量大,耗时高 - Bottom-Up
pipeline:图片 -> 关键点回归(heatmap估计) -> 关键点分组(keypoints grouping) -> 每个人的关键点
不需要做grouping的方法:图片 -> 中心点检测 -> 中心点回归 -> 每个人的关键点
比如centernet。
和Group Conv的区别
- 不同的branch的输入来自于上一级不同的channels组合
- 计算量&参数量更小(没有升维操作,上一级是256通道,假设8个branch,分离之后每个branch通道为32)
其实区别感觉不大。。。