昇思训练营day24学习心得-FCN图像语义分割

最新推荐文章于 2024-07-25 21:56:26 发布

沐礼607

最新推荐文章于 2024-07-25 21:56:26 发布

阅读量139

点赞数 6

文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_66941876/article/details/140648773

版权

介绍

FCN（全卷积网络）是深度学习在图像语义分割领域的里程碑式贡献。它摒弃了传统CNN中的全连接层，转而采用全卷积层，实现了图像到图像的端到端分割。这种方法直接对图像中的每个像素进行预测，生成与原图大小完全一致的label map，即每个像素都被赋予了相应的类别标签。

图像语义分割是图像处理和机器视觉技术中的关键一环，它涉及对图像中每个像素点的细致分类。与普通的图像分类任务不同，语义分割不仅要求识别出图像中的不同对象，还需要将这些对象精确地定位到具体的像素位置上。

模型简介

全卷积神经网络主要使用以下三种技术：

1.卷积化：通过连续的卷积和池化操作提取图像特征，但特征图的尺寸会逐渐减小。

2.上采样：为了恢复特征图的尺寸到原图大小，使用上采样（如双线性插值或转置卷积）技术。

3.跳跃结构：通过结合深层和浅层的特征图，FCN能够同时利用全局信息和局部细节，提高分割精度。FCN-32s、FCN-16s和FCN-8s是不同深度的融合策略。

数据处理

数据预处理：将PASCAL VOC 2012数据集中的图像进行标准化处理。

数据加载：将PASCAL VOC 2012和SDB数据集混合。

训练集可视化：通过可视化加载的数据集图片。

网络构建

FCN网络的构建基于VGG-16的编码器部分，通过添加适当的上采样层和跳跃连接来实现图像的像素级分割。从pool1到pool5逐层池化，然后通过conv6-7进一步提取特征，最后通过不同策略的上采样和融合得到FCN-32s、FCN-16s和FCN-8s的分割结果。

训练准备

导入VGG-16部分预训练权重

损失函数：损失函数选择交叉熵损失函数来计算FCN网络输出与mask之间的交叉熵损失。

自定义评价指标 Metrics

模型训练

导入VGG-16预训练参数后，实例化损失函数、优化器，使用Model接口编译网络，训练FCN-8s网络。

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
昇思训练营day24学习心得-FCN图像语义分割

FCN（全卷积网络）是深度学习在图像语义分割领域的里程碑式贡献。它摒弃了传统CNN中的全连接层，转而采用全卷积层，实现了图像到图像的端到端分割。这种方法直接对图像中的每个像素进行预测，生成与原图大小完全一致的label map，即每个像素都被赋予了相应的类别标签。图像语义分割是图像处理和机器视觉技术中的关键一环，它涉及对图像中每个像素点的细致分类。与普通的图像分类任务不同，语义分割不仅要求识别出图像中的不同对象，还需要将这些对象精确地定位到具体的像素位置上。1.卷积化。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。