语义分割前言

wr319714471

已于 2023-08-01 15:45:38 修改

阅读量29

点赞数

文章标签：人工智能深度学习

于 2023-08-01 11:00:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wr319714471/article/details/132036446

版权

本文介绍了语义分割任务中常见的数据集PASCALVOC与MSCOCO，前者使用调色板表示类别信息，后者包含多边形坐标。提到如何处理不同格式的数据，以及如何通过混淆矩阵计算评价指标，如PyTorch中的实现。

摘要由CSDN通过智能技术生成

语义分割任务常见的数据集格式

1.

PASCAL VOC：提供一个png图片（是以调色板的方式进行存储的，其实他是一个一通道的（黑白）图片），在这个图片中记录有每一个像素所属于的类别信息

可以看到针对目标的边缘和特殊区域（不好分割的目标）会用一个特殊的颜色进行填充，这些位置对应的像素值是255，在训练过程中，计算损失时会忽略掉这些255的地方（因为目标边缘到底属于哪个类别不好区分）

## 如果用python的pylow包去读取图片，默认读取进来的就是调色板模式（p模式）（通道为1），

训练的时候只需要关注每个像素所属于的类别索引就可以了

2.

MS COCO：

针对图片中的每一个目标，都记录了多边形坐标

这里右下角的图像和1.中的是一样的。，只不过没有边缘信息

如果使用mscoco数据集，需要自己将多边形信息解码成png图片，也就是期望的标清形式

在计算损失的时候，拿预测的每一个像素对应的类别与真实标签每一个类别进行对比计算

3.

语义分割得到结果的具体形式

这里图片也是单通道

如果以灰度图像显示，这图看到的就是黑色的，因为他们的像素值都很小，看不出来区别

加了调色板方便可视化预测结果

每个像素的数值对应的是类别的索引

4.

常见的语义分割评价指标

预测正确的·像素总和比上图片的像素个数

##pytorch官方的计算方法

通过构建混淆矩阵进行计算

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语义分割前言

可以看到针对目标的边缘和特殊区域（不好分割的目标）会用一个特殊的颜色进行填充，这些位置对应的像素值是255，在训练过程中，计算损失时会忽略掉这些255的地方（因为目标边缘到底属于哪个类别不好区分）PASCAL VOC：提供一个png图片（是以调色板的方式进行存储的，其实他是一个一通道的（黑白）图片），在这个图片中记录有每一个像素所属于的类别信息。## 如果用python的pylow包去读取图片，默认读取进来的就是调色板模式（p模式）（通道为1），训练的时候只需要关注每个像素所属于的类别索引就可以了。
复制链接

扫一扫

wr319714471 CSDN认证博客专家 CSDN认证企业博客

码龄2年

30: 原创

67万+: 周排名

70万+: 总排名

5278: 访问

: 等级

302: 积分

0: 粉丝

1: 获赞

1: 评论

10: 收藏

私信

关注

热门文章

最新评论

rnn........
CSDN-Ada助手: 恭喜您完成了第20篇博客！阅读您的文章，我深刻感受到了您对于rnn的深入探讨和研究。希望您能够继续保持创作的热情，不断提升自己的技术水平。接下来，建议您可以更多地分享一些实践经验和案例分析，这将会为读者提供更多的参考和帮助。再次感谢您的分享和努力！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply20 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。