机器学习常识 23: U-Net

闵帆

于 2023-06-21 08:44:42 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习常识文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/minfanphd/article/details/131320053

版权

机器学习常识专栏收录该内容

25 篇文章 26 订阅

订阅专栏

摘要: U-Net 集编码-解码于一体, 是一种常见的网络架构.

图 1. U-Net 例.

如图 1 所示, U-Net 就是 U 形状的网络, 前半部分 (左边) 进行编码, 后半部分 (右边) 进行解码.

编码部分, 将一个图像经过特征提取, 变成一个向量. 前面说过: 深度学习本质上只做件事情, 就是特征提取.
解码部分, 将压缩表示解压, 又变成矩阵.
从思想上, 压缩与解压, 这与矩阵分解有几分类似, 都是把数据进行某种形式的压缩表示. 把图片压缩成向量 (而不是两个子矩阵), 想想都可怕.

需要注意, 原始图片可以是多个通道 (如 RGB 3 色对应于 3 通道), 中间层与输出层也可以是多通道.

U-Net 可以用于很多的任务:

自编码器. 直接将输入数据作为标签, 看编码导致的损失 (更像矩阵分解了).
从一种风格转换为另一种风格. 如将自然照片转换成卡通风格, 将地震数据转换成速度模型 (2010年如果你这么做会被业内人士笑话的).
图像分割, 或提取图片的边缘. 嗯, 这个和转成卡通风格也差不多.
机器翻译. 把句子编码成机器内部的表示 (一种新的世界语言?), 然后转成其它语言的句子.
输入一个头, 输出多个头, 就可以做多任务. 如在速度模型反演的同时, 进行边缘提取, 这样导致反演的结果更丝滑.

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
机器学习常识 23: U-Net

U-Net 集编码-解码于一体, 是一种常见的网络架构.
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。