FCN应用：利用FCN全卷积网络实现语义分割 CamVid数据集

VIP文章码农男孩

已于 2022-04-30 21:17:11 修改

阅读量2.4k

点赞数 5

分类专栏：图像分割深度学习文章标签：计算机视觉深度学习图像处理神经网络目标检测

于 2022-04-21 10:11:18 首次发布

本文链接：https://blog.csdn.net/m0_62128864/article/details/124313359

版权

一、训练数据集介绍

CamVid数据集，语义分割FCN训练数据集

CamVid数据集包括 700 多张精准标注的图片用于强监督学习，可分为训练集、验证集、测试集。同时，在 CamVid 数据集中通常使用 11 种常用的类别来进行分割精度的评估，分别为：道路（Road）、交通标志（Symbol）、汽车（Car）、天空（Sky）、行人道（Sidewalk）、电线杆（Pole）、围墙（Fence）、行人（Pedestrian）、建筑物（Building）、自行车（Bicyclist）、树木（Tree）。数据集中的CSV文件代表着不同类别的RGB通道值

1.1 数据预处理---标签编码

class LabelProcessor:   
    def __init__(self, file_path):

        self.colormap = self.read_color_map(file_path)

        self.cm2lbl = self.encode_label_pix(self.colormap)

    @staticmethod
    def read_color_map(file_path):  
        pd_label_color = pd.read_csv(file_path, sep=',')
        colormap = []
        for i in range(len(pd_label_color.index)):
            tmp = pd_label_color.iloc[i]
            color = [tmp['r'], tmp['g'], tmp['b']]
            colormap.append(color)
        return colormap
'''
    函数encode_label_color(colormap)，形成颜色到标签的一一对应关系，下面使用了类似256进制的方法映射每一个color map里的像素点到它所表示的类别
    （用哈希函数做了一张哈希表）

    希函数：(cm[0] * 256 + cm[1]) * 256 + cm[2]
    哈希映射：cm2lbl[(cm[0] * 256 + cm[1]) * 256 + cm[2]] = i
    哈希表：cm2lbl
    　　原理：一个像素点如:P（128，64，128）由编码函数(P[0] * 256 + P[1]) * 256

最低0.47元/天解锁文章

码农男孩

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
17
评论
FCN应用：利用FCN全卷积网络实现语义分割 CamVid数据集

语义分割，简单地说，分割就是抠图。语义分割，就是按图像中物体表达的含义进行抠图。相比传统的目标识别，语义分割它更强大。语义分割模型不仅可以识别简单的类别，而且还可以进行多目标、多类别、复杂目标以及分割目标。截至到2017年底，我们已经分化出了数以百计的模型结构。当然，经过从技术和原理上考究，我们发现了一个特点，那就是当前最成功的图像分割深度学习技术都是基于一个共同的先驱：FCN（Fully Convolutional Network，全卷积神经网络）。
复制链接

扫一扫