coco 输出格式，MPII 输出格式，标注

奋斗的Brandon

已于 2023-03-16 18:38:53 修改

阅读量1.5k

点赞数 1

分类专栏：姿态识别文章标签： python openpose opencv

于 2021-11-08 11:38:08 首次发布

本文链接：https://blog.csdn.net/qq_43033547/article/details/121204281

版权

姿态识别专栏收录该内容

11 篇文章 1 订阅

订阅专栏

pose

1，数据集
- coco 输出格式
- MPII 输出格式
代码：
详解：
- 1、
- 2、blobFromImage函数

1，数据集

BODY25:

COCO: .

MPI: .

coco 输出格式

鼻子– 0，颈部– 1，

右肩– 2，右肘– 3，右手腕– 4，

左肩– 5，左肘– 6，左手腕– 7，

右臀部– 8，右膝– 9 , 右脚踝 – 10,

左臀部 – 11, 左膝盖 – 12, 左脚踝 – 13,

右眼 – 14, 左眼 – 15, 右耳 – 16, 左耳 – 17,

背景 – 18

在这里插入图片描述

MPII 输出格式

0 - 右脚踝 (right ankle)
1 - 右膝盖 (right knee)
2 - 右髋部 (right hip)
3 - 左髋部 (left hip)
4 - 左膝盖 (left knee)
5 - 左脚踝 (left ankle)
6 - 骨盆 (pelvis)
7 - 胸部 (thorax)
8 - 颈部 (neck)
9 - 头顶 (head top)
10 - 左手腕 (left wrist)
11 - 左肘 (left elbow)
12 - 左肩 (left shoulder)
13 - 右肩 (right shoulder)
14 - 右肘 (right elbow)
15 - 右手腕 (right wrist)
以上16个关键点被广泛应用于人体姿态估计领域，可以用于训练和评估各种类型的人体姿态估计模型，如单人姿态估计、多人姿态估计、动态姿态估计等。

代码：

if MODE is "COCO":
    protoFile = "pose/coco/pose_deploy_linevec.prototxt"
    weightsFile = "pose/coco/pose_iter_440000.caffemodel"
    nPoints = 18
    POSE_PAIRS = [ [1,0],[1,2],[1,5],[2,3],[3,4],[5,6],[6,7],[1,8],[8,9],[9,10],[1,11],[11,12],[12,13],[0,14],[0,15],[14,16],[15,17]]

elif MODE is "MPI" :
    protoFile = "pose/mpi/pose_deploy_linevec_faster_4_stages.prototxt"
    weightsFile = "pose/mpi/pose_iter_160000.caffemodel"
    nPoints = 15
    POSE_PAIRS = [[0,1], [1,2], [2,3], [3,4], [1,5], [5,6], [6,7], [1,14], [14,8], [8,9], [9,10], [14,11], [11,12], [12,13] ]

详解：

1、

.prototxt 文件，它指定了神经网络的架构——不同层的排列方式等。
.caffemodel 文件，用于存储训练模型的权重

2、blobFromImage函数

函数cv2.dnn.blobFromImage(image[, scalefactor[, size[, mean[, swapRB[, crop[, ddepth]]]]]])

平均值（mean）
缩放系数（scalefactor）
交换RB通道（swapRB）
图像裁剪（crop）

blobFromImage(InputArray image, 
			  double scalefactor=1.0, 
		      const Size& size = Size(),
			  const Scalar& mean = Scalar(), 
			  bool swapRB = false, 
			  bool crop = false,
			  int ddepth = CV_32F)

inpBlob = cv2.dnn.blobFromImage(frame, 1.0 / 255, (inWidth, inHeight),
                          (0, 0, 0), swapRB=False, crop=False)

作用：
对图像进行预处理，包括减均值，比例缩放，裁剪，交换通道等，返回一个4通道的blob(blob可以简单理解为一个N维的数组，用于神经网络的输入)

各参数的意义

image

输入图像

scalefactor

当我们将图片减去平均值之后，还可以对剩下的像素值进行一定的尺度缩放，它的默认值是1，如果希望减去平均像素之后的值，全部缩小一半，那么可以将scalefactor设为1/2

mean

需要将图片整体减去的平均值，如果我们需要对RGB图片的三个通道分别减去不同的值，那么可以使用3组平均值，如果只使用一组，那么就默认对三个通道减去一样的值。减去平均值（mean）：为了消除同一场景下不同光照的图片，对我们最终的分类或者神经网络的影响，我们常常对图片的R、G、B通道的像素求一个平均值，然后将每个像素值减去我们的平均值，这样就可以得到像素之间的相对值，就可以排除光照的影响。

swapRB

是否交换RB，OpenCV中认为我们的图片通道顺序是BGR，但是我平均值假设的顺序是RGB，所以如果需要交换R和G，那么就要使swapRB=true

crop

图像裁剪,默认为False.当值为True时，先按比例缩放，然后从中心裁剪成size尺寸

size

输出图像的空间尺寸,如size=(200,300)，Width=200, Height=300

ddepth

当cv2.imshow()处理图像深度为CV_8U（默认范围为[0,255]）时，按原数据显示；当处理图像深度为CV_16U（默认范围为[0,65535]）时，除以256,映射到[0,255]；当图像深度为CV_32F和CV_64F时（默认范围为[0,1]），乘以255映射到[0,255]；当碰到负数时，首先取其绝对值，然后按照上述图像深度将超出数据范围的部分采取截断操作，最后映射到[0,255]显示图像

奋斗的Brandon

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
coco 输出格式，MPII 输出格式，标注

1，数据集coco 输出格式鼻子– 0，颈部– 1，右肩– 2，右肘– 3，右手腕– 4，左肩– 5，左肘– 6，左手腕– 7，右臀部– 8，右膝– 9 , 右脚踝 – 10,左臀部 – 11, 左膝盖 – 12, 左脚踝 – 13,右眼 – 14, 左眼 – 15, 右耳 – 16, 左耳 – 17,背景 – 18MPII 输出格式头 – 0,颈部 - 1，右肩 - 2，右肘 - 3，右手腕 - 4，左肩 - 5，左肘 - 6，左手腕 - 7，右臀部 - 8，右膝盖 - 9，右脚
复制链接

扫一扫

专栏目录