U-net

long_respect

已于 2022-08-08 08:50:44 修改

阅读量789

点赞数

文章标签：计算机视觉人工智能深度学习

于 2022-07-25 23:04:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43945111/article/details/125984312

版权

图像分割

1.语义分割

逐像素点进行分类,具体而言对图像每个像素打上标签（如A部分是树，B部分是人）

2.实例分割

再进行细分，区分类别中的每一个个体。（如B部分有x,y人）

损失函数

1.逐像素的交叉熵：图像每个点进行分类
2.样本均衡问题：图像包含的每部分占的比例不同，加入权重
3.损失函数

评估指标MIOU

groudtruth与prediction之间的交并比，越接近1，越真实。

3.U-net

整体架构

tip

RGB图像一般存储为MxNx3的多维数据矩阵，而灰度图像才由二维数组表示。
RGB图像是三维

具体说明

输入224x224x3的图像，逐像素点输出前景（人1）和背景信息（0非人），得到二分类图像224x224x2

输入图像-输出图像

首先卷积+池化进行特征提取（下采样），然后上采样恢复图像大小。
简而言之就是编码（输入的图像）到解码（输出的图像）的过程。

拼接：网络中浅层的和深层的特征进行拼接

基本思想

4.U-net++

拼接

过浅层的网络和深层网络拼接不太理想，下采样后直接上采样，效果更好

损失函数

最后使用损失函数评估改为多步使用损失函数

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
U-net

逐像素点进行分类,具体而言对图像每个像素打上标签（如A部分是树，B部分是人）
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。