1. 项目说明
图像语义分割在计算机视觉中是一个基本但具有挑战性的任务。它旨在提供详细的像素级图像分类,相当于为每个像素分配语义标签。该技术目前被广泛应用于城市安防、路况判断等系统领域。以我们选用的 KITTI-STEP 数据集为例,该项目的挑战在于:
1. 目标复杂
- 道路复杂,包含直行,转弯,红绿灯路口等;
- 环境复杂,要适应白天、黑夜、雾天和雨天等;
- 场景复杂,城市道路、乡村、高速公路等场景差异性较大;
2. 样本不均衡
- 类别多,包含:路面、人行道、建筑物、墙、栅栏、杆子、交通灯、交通标志、植被、地面、天空、人、骑车的人、车、卡车、巴士、火车、摩托车、自行车;
- 每张图像中最多达15辆车和30个行人,以及各种程度的遮挡与截断;
部分图像示例如下:
图 1 - KITTI-STEP 数据集示例
完整代码请移步这里哦:基于MScaleOCR的城市道路交通要素分割 - 飞桨AI Studio
欢迎各位朋友扫码获取视频资料加入技术交流群:
2. 安装说明
2.1 环境要求
- paddlepaddle >= 2.0.0rc1
- Python >= 3.6
强烈建议您安装/使用 GPU 版本的 PaddlePaddle。因为分割模型开销很大,当模型运行在 CPU 时可能会出现内存不足。更详细的安装教程请参考 PaddlePaddle 官网
2.2 解压数据及代码
项目代码在 paddleseg-kitti.tar
文件中,数据集在 kittistep.tar
文件中,解压到合适路径即可使用。
In [ ]
# 如果希望解压到其他目录
# 可选择其他路径(默认 /home/aistudio )
%cd ~
! unzip -qo ~/data/data141231/paddleseg-k