昇思25天学习打卡营第9天|FCN图像语义分割

最新推荐文章于 2024-08-22 17:05:56 发布

Xavier_F

最新推荐文章于 2024-08-22 17:05:56 发布

阅读量405

点赞数 3

文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xavier_F/article/details/140535209

版权

全卷积网络（Fully Convolutional Networks，FCN）由UC Berkeley的Jonathan Long等人在2015年提出，用于端到端的图像语义分割。

一、语义分割

语义分割是对图像中每个像素点进行分类，输出与输入大小相同的分类图。应用广泛，如人脸识别、自动驾驶等。

二、FCN简介

FCN是首个端到端的分割方法，通过像素级的预测直接得到与原图大小相等的标签图。FCN丢弃全连接层，全部使用卷积层。

核心技术

1. 卷积化：将全连接层转换为卷积层，生成输入图片映射的heatmap。
2. 上采样：通过反卷积层恢复特征图尺寸。
3. 跳跃结构：结合不同深度层的特征图，获取更多细节。

三、网络特点

1. 适应任意尺寸输入：全卷积网络不含全连接层。
2.精细输出：使用反卷积层增大数据尺寸。
3. 鲁棒性与精确性：跳跃结构结合全局和局部信息。

四、数据处理

确保本地安装Python和MindSpore，预处理PASCAL VOC 2012数据集。

数据加载

混合PASCAL VOC 2012和SBD数据集。

训练集可视化

运行代码观察预处理后的数据集图片。

五、网络构建

网络流程

1. 输入图像经过多次池化，特征图尺寸逐渐减小。
2. 通过反卷积层恢复特征图尺寸。
3. 跳跃结构融合不同层特征图，逐步恢复到原图尺寸。

训练准备

导入VGG-16预训练权重

使用VGG-16作为骨干网络。

损失函数

交叉熵损失函数计算FCN输出与mask的差异。

自定义评价指标

计算模型性能的评估指标，如Pixel Accuracy (PA)、Mean Pixel Accuracy (MPA)、Mean Intersection over Union (MIoU)、Frequency Weighted Intersection over Union (FWIoU)。

六、模型训练

导入预训练参数后，实例化损失函数和优化器，使用Model接口编译网络并训练。

七、模型评估

评估训练好的模型性能。

八、模型推理

使用训练的网络展示推理结果。

九、总结

FCN通过全卷积层实现端到端分割，具有以下优点：

1. 接受任意大小输入图像。
2. 高效：避免像素块带来的重复计算。

待改进之处：

1. 结果不够精细：上采样结果较模糊。
2. 缺乏空间一致性：未充分考虑像素之间的关系。

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
昇思25天学习打卡营第9天|FCN图像语义分割

FCN是首个端到端的分割方法，通过像素级的预测直接得到与原图大小相等的标签图。FCN丢弃全连接层，全部使用卷积层。计算模型性能的评估指标，如Pixel Accuracy (PA)、Mean Pixel Accuracy (MPA)、Mean Intersection over Union (MIoU)、Frequency Weighted Intersection over Union (FWIoU)。FCN通过全卷积层实现端到端分割，具有以下优点：1. 接受任意大小输入图像。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。