人体解析任务和 Look into Person数据集（附源码分享）

最新推荐文章于 2024-09-13 07:35:17 发布

hyk_1996

最新推荐文章于 2024-09-13 07:35:17 发布

阅读量8.4k

点赞数 12

分类专栏：人体语义解析文章标签： CNN PyTorch 人体解析计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hyk_1996/article/details/91974621

版权

人体语义解析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

人体解析任务

人体解析（human parsing），属于语义分割任务的子任务，旨在对人类图像进行像素级的是细粒度分割（例如，划分出身体部位和服装）。根据不同的场景，又可以分为单人人体解析（single-person human parsing）和多人人体解析（multi-person human parsing，或者 instance-level human parsing）。除此之外，按照处理媒介分类，还可以分为基于图像的人体解析和基于视频的人体解析。

对于人体解析任务，常用的度量指标包括 Pixel accuracy(%) , Mean accuracy(%), Mean IoU(%) 和 Frequency weighted IoU(%).

多人人体解析

Look into Person数据集

Look into Person (LIP) 是一个大规模的人体语义解析数据集，它包括了带有像素级人体部位标注（19种人体部位类别）和2D姿势标注（16个关键点）的50000张图像。这50000张图像裁剪自COCO数据集中的人物实例，图像尺寸均大于50 * 50. 它们覆盖了真实世界的各种场景，包括姿势和视角的改变、严重的遮挡、变化的外观以及低分辨率。

实际上，该数据集可以分为四个部分，分别为：单人人体解析，多人人体解析，基于视频的多人人体解析，基于图像的虚拟试衣。可以从该数据集官网中得到下载链接（包括百度云盘和谷歌云盘链接）。

在这里我们主要讨论第一个部分，即单人人体解析数据集。它包括了19种类别标签加上背景标签，所以一共是20种类别：

Background
Hat
Hair
Glove
Sunglasses
Upper-clothes
Dress
Coat
Socks
Pants
Jumpsuits
Scarf
Skirt
Face
Left-arm
Right-arm
Left-leg
Right-leg
Left-shoe
Right-shoe

LIP数据集样本实例

baseline代码分享

该baseline模型基于PSPNet，其中的特征提取主干可以选择resNet50、denseNet121、squeezeNet或者其它模型。

源码链接如下：

https://github.com/hyk1996/Single-Human-Parsing-LIP

如果觉得有帮助，欢迎star和fork，如果需要已经训练好的网络模型可以通过下面链接下载。

Baidu Drive (提取码：43cu)

实验结果和可视化如下：（可视化代码也包含在源码里了）

关注

12
点赞
踩
41

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。