语义分割_U-net

最新推荐文章于 2023-04-30 01:09:49 发布

Monday_getStart

最新推荐文章于 2023-04-30 01:09:49 发布

阅读量349

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Monday_getStart/article/details/107377648

版权

深度学习专栏收录该内容

9 篇文章 2 订阅

订阅专栏

前两天简单入门学习图像分割，学习了最基础的U-net，实现训练自己的数据集，今天做一些简单的记录。
参考的文章：
https://arxiv.org/pdf/1505.04597v1.pdf
https://cloud.tencent.com/developer/article/1354435
https://blog.csdn.net/Formlsl/article/details/80373200

1.图像分割_语义分割（semantic segmentation）

semantic segmentation is understanding an image at pixel level
它的目标是标记图像中每个像素类别。因此我们需要需要预测图像中的每一个像素，这类任务也被称为密集预测，简单的示意图如下。

在这里插入图片描述
其主要的应用方向之一就是医学图像的处理啦

这可以辅助放射科医生进行分析，减少诊断所需的时间。

然后我们学习的u-net网络是全卷积网络（FCN）的一个变体，其网络结构如下图
在这里插入图片描述
简单总结其优点就是：

对比FCN，结构上变化较大的地方是上采样阶段，从结构上看上采样层包含了很多层的特征
在医学图像领域，图像的数据较少，u-net更适合这种训练数据较少的情况
在训练时，相比较FCN，训练次数的减少。

然后还想记录一下的就是其中的conv2DTranspose
比如33的卷积核，然后44的输入，6*6的输出，填充0，其简单的示意图如下：
在这里插入图片描述

然后又很多实现的代码，我自己down下来，跑了一下，看了一下效果，具体看了一下网络结构的实现，然后也上传到我的仓库啦：https://github.com/noDreamNoLife/hugay

不过有几个很简单的疑问，为什么没有简单进行padding操作呢？可能是不是当时padding不是很流行哈哈，然后是不是用一下BN是不是会好一点呀。

Monday_getStart

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。