自动驾驶场景图像分割(Unet)

本文使用matlab环境,测试了自动驾驶场景的图像分割任务。分割网络使用Unet。

一千张标注图像,最终训练精度达到 90%。

 

 数据准备

场景预标注数据下载地址:Semantic Segmentation for Self Driving Cars | Kaggle

数据下载可能需要翻墙,如果无法下载可移步 自动驾驶场景图像-分割标注数据.zip

数据标注了13个类别,每个类别具体名字未知,随便给个类名测试。

imagedir="E:\DLDatasets\kaggle\SelfDriving\dataA\dataA\CameraRGB";
labeldir="E:\DLDatasets\kaggle\SelfDriving\dataA\dataA\CameraSeg";

classNames=["c0","c1","c2","c3","c4","c5","c6","c7","c8","c9","c10","c11","c12"];
labelIds=0:12;

imds=imageDatastore(imagedir, "ReadFcn",@readImage);
pxds=pixelLabelDatastore(labeldir,classNames,labelIds,"ReadFcn",@readLabel);

ds=combine(imds,pxds);

图像原始大小为 600x800,首先自定义数据读取函数将其缩放到 96x128,另外标注图像是三通道,需要将其转成单通道图像。

function [data] = readImage(path)
    data=imread(path);
    data=imresize(data,[96 128]);
end

function [data] = readLabel(path)
    data=imread(path);
    data=data(:,:,1);
    data=imresize(data,[96 128]);
end

定义网络及参数

% 定义网络
imageSize = [96 128 3];
numClasses = 13;
lgraph = unetLayers(imageSize, numClasses);
% 训练参数
options = trainingOptions('adam', ...
    'InitialLearnRate',1e-3, ...   % 1e-4不收敛,改为1e-3
    'MaxEpochs',100, ...
    "MiniBatchSize", 8,...
    'VerboseFrequency',50, ...
    'Plots','training-progress');

 训练

net = trainNetwork(ds,lgraph,options)

最终训练情况

 测试

pic = imread("E:\DLDatasets\kaggle\SelfDriving\dataA\dataA\CameraRgb\02_00_120.png");
msk = imread("E:\DLDatasets\kaggle\SelfDriving\dataA\dataA\CameraSeg\02_00_120.png");
pic = imresize(pic, [96,128]);
msk = imresize(msk, [96,128]);
msk=msk(:,:,1);
out2 = predict(net,pic);

[h,w,~] = size(out2);
result = uint8(zeros(h,w));

for y = 1:h
    for x = 1:w
        [~,i]=max(out2(y,x,:));
        result(y,x)=i-1;
    end
end

result = result*20;

msk = msk*20;

subplot(1,3,1)
imshow(pic)
subplot(1,3,2)
imshow(result,'Colormap',jet(255))
subplot(1,3,3)
imshow(msk,'Colormap',jet(255))

 

 

 

  • 5
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
图像分割计算机视觉领域中的重要任务,其目标是将图像分割成多个不同的区域,以便更好地理解图像中的内容。UNet是一种常用于图像分割深度学习模型,通过使用PyTorch框架,可以更加高效地实现UNet模型。 UNet模型由编码器和解码器组成,编码器用于提取图像的特征,而解码器则用于将提取到的特征映射回原始图像尺寸。在PyTorch中,可以使用nn.Module来定义UNet模型的结构,通过继承nn.Module类来自定义编码器和解码器的网络结构,然后使用torch.nn.functional中的函数来定义模型的前向传播过程,实现特征提取和特征映射。 在训练UNet模型时,可以使用PyTorch提供的优化器和损失函数来对模型进行优化,如Adam优化器和交叉熵损失函数。通过对训练数据进行迭代训练,可以不断优化UNet模型,以使其能够更好地实现图像分割任务。 在应用UNet模型进行图像分割时,可以使用PyTorch提供的图像处理库对输入图像进行预处理,并使用训练好的UNet模型对图像进行分割,得到分割后的图像结果。这样可以快速、高效地实现图像分割任务,并且在PyTorch框架中还可以使用GPU加速来提高计算速度。 总之,通过使用PyTorch框架实现UNet模型进行图像分割任务,可以更加方便地定义模型结构、训练模型和应用模型,从而实现高效、准确的图像分割

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ango_Cango

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值