Carla语义分割图数据的进阶处理

最新推荐文章于 2023-11-12 16:21:32 发布

蛋总的快乐生活

最新推荐文章于 2023-11-12 16:21:32 发布

阅读量1.3k

点赞数 3

分类专栏： CARLA 无人驾驶文章标签： carla 语义分割图无人驾驶仿真平台自动驾驶

本文链接：https://blog.csdn.net/qwe900/article/details/119867521

版权

无人驾驶同时被 2 个专栏收录

10 篇文章 11 订阅

订阅专栏

CARLA

8 篇文章 7 订阅

订阅专栏

本文介绍了在Carla中设置语义分割传感器的方法，包括使用cc.Raw和cc.CityScapesPalette两种类型。通过示例代码展示了如何处理语义分割图像，将标签从Raw数据中提取并进行颜色映射。同时，提供了处理和可视化语义分割图的步骤，包括将原始数据转换为图像，获取标签并将其上色显示。

摘要由CSDN通过智能技术生成

详细代码可见Carla的manual_control.py中的语义分割传感器设置。这里只做核心部分的讲解。链接：https://github.com/carla-simulator/carla/blob/master/PythonAPI/examples/manual_control.py#L1042

一、设置语义分割传感器

['sensor.camera.semantic_segmentation', cc.Raw, 'Camera Semantic Segmentation (Raw)', {}],
['sensor.camera.semantic_segmentation', cc.CityScapesPalette,
                'Camera Semantic Segmentation (CityScapes Palette)', {}],

注意这里用的是cc.Raw类型，也就是原始数据。
另一种类型是cc.CityScapesPalette,将城市类型的标签上色后存储的图片。类似于下图：

二、语义分割的标签

链接：https://carla.readthedocs.io/en/latest/ref_sensors/#semantic-segmentation-camera
不同的类别具有不同的颜色，举个例子如下图所示：

三、如何设置我想要的语义分割图呢？

3.1 摄像头传感器处理`raw_data`

    array = np.frombuffer(image.raw_data, dtype=np.dtype("uint8"))
    array = np.reshape(array, (image.height, image.width, 4))
    array = array[:, :, :3]
    array = array[:, :, ::-1]
    if self.recording:
    	image.save_to_disk('%08d' % image.frame)

第一步，将这个流数据转换为设置摄像头时候的图片大小
第二步，将[h,w,4]转换为[h,w,3]
第三步，如果选择存储的话，那么保存的是image，大小为[h,w,4]

3.2 处理语义分割图的`cc.Raw`

在文档中，标签存储在了Red通道，也就是第0个通道，存着对应的标签，因此先定义第一个函数，找到标签。

def process_image(image):
    # [480,640,4] --> [480,640,3]
    image = image[:, :, :3]

    # [0,1] --> [0,255]
    image = image * 255

    # Get the r channel
    sem = image[:, :, 0]

    return sem

设置语义分割的字典，label-->color

SEM_COLORS = {

    4: (220, 20, 60),
    6: (157, 234, 50),
    7: (128, 64, 128),
    10: (0, 0, 142),

}

将对应位置的标签上色

def visualize_semantic(sem, labels=[4, 6, 7, 10]):
    canvas = np.zeros(sem.shape + (3,), dtype=np.uint8)
    # print("shape of canvas:",canvas.shape)
    for label in labels:
        # print(label)
        canvas[sem == label] = SEM_COLORS[label]

    return canvas

3.3 最终效果

    # Add the file dircetory
    file_name = "EgoRgb/21057685.png"

    # Load the image
    image = plt.imread(file_name)

    print("shape of image", image.shape)
    
    # Get red channel labels
    sem = process_image(image)

    # Convert to the rgb sematic color
    vis_image = visualize_semantic(sem)

    plt.imshow(vis_image)