ps语义分割_图像语义分割训练经验总结--图像语义分割

最新推荐文章于 2024-02-27 11:44:46 发布

weixin_39755824

最新推荐文章于 2024-02-27 11:44:46 发布

阅读量296

点赞数

文章标签： ps语义分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39755824/article/details/111963689

版权

本文总结了使用PyTorch进行图像语义分割的实践经验，涵盖二分类和多分类问题。在二分类中，Unet输出通道为1，损失函数通常使用nn.BCELoss。对于多分类，Unet输出通道等于类别数，损失函数为nn.CrossEntropyLoss，该函数自动处理one hot编码。在训练时，直接计算模型输出和Label的Loss，而在测试时，可通过argmax获取预测标签以计算精度。此外，针对多分类问题，可以通过多个二分类问题的方式提高精度。

摘要由CSDN通过智能技术生成

最近一直在学pytorch，copy了几个经典的入门问题。现在作一下总结。

首先，做的小项目主要有

分类问题：Mnist手写体识别、FashionMnist识别、猫狗大战

语义分割：Unet分割肝脏图像、遥感图像

先把语义分割的心得总结一下，目前只是一部分，以后还会随着学习的深入慢慢往里面加新的感悟。

1)对于二分类问题

1. Unet输出channel：对于二分类问题，类别数为2，channel为1，用uint8的单通道灰度图像表示类别就行(0/1)。

2. label是单通道灰度图像，直接传给损失函数。

3. 损失函数：nn.sigmoid + nn.BCELoss / nn.BCEWithLogitsLoss，此时计算loss的ouput和label维度应该保持一致。batchsize*1*h*w

2)对于多分类问题

1. Unet输出channel：输出channel是类别数。网络的输入是img，网络的输出是one hot编码的多通道图像。

2. Label是单通道灰度图像，不同的灰度级表示不同的类别。用于传给损失函数，计算Loss。

具体操作方面，第一步有人说先将Label进行one hot编码(即转换成多通道图，一个通道一个类别)，这样才能用交叉熵计算损失；也有人说不需要one hot编码，直接把单通道Label作为损失函数的Label。

其实这两个人说的都不错，但第一个人并没有用Pytorch做，而第二个人是用Pytorch和nn.CrossEntropyLoss计算损失的。

在多分类问题中&#x

最低0.47元/天解锁文章

weixin_39755824

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。