拜读曹哲的Realtime Multi-Person 2D Pose Estimation using Part Affinity Fileds

曹哲【实时多人人体姿态识别】视频回放>>https://pan.baidu.com/s/1mhVRhpu;

PDF及参考资料>>https://pan.baidu.com/s/1i5qqaw9;

算法方面的话可以看视频还有PPT,我说不好,我记录一下视频在问答环节的一些问题和在观看视频中听到的一些关键信息。

非关键点检测后极大值抑制
17个点,30个人,点分类
中点作为确信值(空间错误),增加中点的数量不能解决这个问题
所以提出了部分亲和力场
通过拟合关系得到确信值(可以完美预测正确的连接)
KD匹配问题,NP难问题(只考虑相邻关键点连接,人体用树状结构连接,不在全局优化,只在部分关键点考虑,贪心的方法)
预测人体部分亲合场的网路结构,多层卷积的结构
网络结构分成两部分(关键点检测,躯干的亲和力场(位置,方向))
在Coco和MPI数据上进行测试
问题记录:
1:怎样进行人体关键点的跟踪?openpose没有进行关键点跟踪,是对每一帧关键点检测,然后连接
2:对于遮挡的身体节点训练集上的标定数据是什么?30%在COCO有标定,MPI在80%情况下有标定
3:矢量用角度表示?矢量场用x,y,类似于光流场,2个方向
4:矢量场如何进行网络训练?需要提前标注矢量场数据吗?不需要提前标注,在两个关键点画椭圆,调参数,加单位矢量。
5:何时可以支持caffe框架?
6:单个gpu处理如何优化?简化网络结构,把kenel减小加速25%,减少网络阶段,现在有6个阶段,可以提高25%速度,考虑用原图的大小,
不进行缩放可以提高25%,可以牺牲准确率
7:GPU型号:Tantx,GTX1080
8:手部关键点数据会公开吗?会公开,在CVPR之前公开。
9: 在固定网络分辨率和图片分辨率,能够检测最小骨架分辨率是多少,请计算出来?具体大小很难表达出来,在40*40的像素点
方框,可以检测出来。
10:这个方法可以检测手势吗?不是很难得问题,可以把手关键点的热点图叠加卷积进行识别,有标定的结果,就变成简单
的训练神经网络的问题了。
11:讲一下Failure Case?人关键点重叠,不确定手是直的还是曲择。2D的缺陷,从3D来看,深度是不一样的(具有挑战,未解决)。
12:关键点重叠可以处理吗?很难得到正确结果。默认一个关键点只能连接一个关键点。
13:手的标注集中式怎么得到的?利用多摄像机系统,过滤许多不正确的检测结果,用多摄像机得到的结果作为下个训练集的输入,反复迭代
可以得到比较好的结果,这也是CMU的训练的方法,模糊训练,含糊迭代,最后得到比较好的结果。
14:MASK_RCNN,在COCO数据集上最好的,基于Faster-RCNN加了几个分支,一个做图片分割,一个做关键点检测,是自顶向下的方法。
15:手部数据集有多少张图像?数据集很大,需要花一定时间把所有图片处理完再公开出来。







### 回答1: 实时多人二维姿态估计使用的是部件关联场技术。该技术利用深度学习网络对图像中的人体关键点进行检测和定位,并通过学习人体部位之间的关联性来提高姿态估计的准确性。在实时性方面,该技术利用高效的网络结构和并行计算技术,能够在处理多人图像时保持较高的处理速度和较低的延迟。 ### 回答2: 实时的多人2D姿态估计是指在照片或视频中同时检测多个人的姿态并实时反馈结果。这个任务主要是依赖计算机视觉领域的人体关键点检测技术。而Part Affinity Fields(PAF)是现在最常用的一种检测方法。 PAF可以理解为是人体姿态中的“骨架”,它在这里指的是需要将骨骼节点间的关系一同考虑进去来提高精度的设计。每个PAF都对应着一对关联的节点,例如手臂这一关节对应的PAF就是肩膀和手腕两个关键点中间的向量场。PAF能够将关键点之间的联系编码为一个向量场,并将它们的图像位置和方向作为通道特征,这样就可以通过深度卷积网络获得节点的连接信息。 对于多人2D姿态估计任务,PAF可以自动推断出人体的椭圆形状,使得不同人的节点互相不干扰,能够高效地分离不同人体之间的关键点信息,保证检测精度。 总体而言,实时的多人2D姿态估计技术是计算机视觉研究领域中一个非常重要的方向。通过Part Affinity Fields技术,可以实现对人体姿态的快速准确检测和分析,并具有广泛的应用前景,比如拍摄跳舞类视频、体育比赛等。未来,该领域还将会不断提高研究和开发技术,提高其在实际场景中的使用效果,为人们的生产和生活提供更多更好的便利。 ### 回答3: 在计算机视觉领域,人体姿态估计一直是一个十分重要的研究方向。现在,研究者们正在致力于开发实时多人二维姿态估计方法,本文将介绍一种方法——part affinity fields。 Part affinity fields是指身体部位之间存在的空间关系矩阵。多人姿态估计就是先将图像中的每一个像素与人体相关的身体部件联系起来,然后再利用network output将这些点连接起来形成人体姿态。part affinity fields的基本思想是采用CNN对每一个像素做预测,以定位人体骨架上的每一个连接点。 主要步骤: 1.生成部件置信图:对于输入的图像,通过CNN估计每个像素是否为其中每个身体部位的一部分,这个图叫做部件置信图(Part Confidence Maps),可以通过训练数据集来检测出身体部位的位置。 2.生成连接部件映射图:对于预测出来的部件置信图,我们可以通过预测到的部件之间的关系来学习生成连接映射图(Part Affinity Fields),即学习两个不同身体部件之间的关系(connectivity),这个关系是一个形状为“c×2×h×w”的4维张量。在测试阶段,对于输入图像中的每个像素,都会有其对应到一个连接部件映射图的位置。 3.生成姿态结果:最后,我们将生成的部件置信图和连接部件映射图进行联合,把已确定的部件通过连接映射图装配起来并组合成人体的姿态结果。 这种方法最大的好处就是实现了实时多人姿态估计,不需要预设一个特定数量的人数。同时,在处理不同人的关键点时,以前的方法通常是对每个人都单独进行估计,而这个方法则对所有人的关键点一起进行估计,能够更好地处理人际交互。 总之,通过深度学习和部件置信图与连接映射图等技术手段的利用,Part Affinity Fields在解决实时多人二维姿态估计时具有很大的潜力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值