自动驾驶数据集,包含10万张图片
yolo可直接使用
可用于自动驾驶目标识别研究
标注十个目标类别:
["person", "rider", "car", "bus", "truck", "bike", "motor", "traffic light", "traffic sign","train"]
自动驾驶目标识别数据集介绍
数据集概览
这个自动驾驶数据集是一个大规模的图像数据集,专门用于训练和评估自动驾驶系统中的目标识别模型。数据集包含10万张图片,并且已经按照YOLO(You Only Look Once)格式进行了标注,可以直接用于基于YOLO架构的目标检测任务。
数据集特点
- 数据量大: 包含10万张高分辨率图像,提供了丰富的训练样本。
- 多类别标注: 标注了十个常见的交通相关目标类别,涵盖行人、骑行者、车辆、交通信号灯等。
- 高质量标注: 所有图片均经过精确标注,确保了数据的质量。
- 直接可用: 数据集已经按照YOLO格式组织,可以直接用于训练和测试。
类别列表
数据集中包含以下十个目标类别:
person
(行人)rider
(骑行者)car
(汽车)bus
(公交车)truck
(卡车)bike
(自行车)motor
(摩托车)traffic light
(交通信号灯)traffic sign
(交通标志)train
(火车)
应用场景
- 自动驾驶系统: 用于实时检测道路上的各种目标,提高自动驾驶的安全性和可靠性。
- 智能交通管理: 通过分析交通流量和行为模式,优化交通管理和规划。
- 行人安全监测: 在城市环境中监测行人活动,预防交通事故。
- 交通违规监控: 识别交通违规行为,如闯红灯、超速等。
数据集结构
假设数据集文件夹结构如下:
autonomous_driving_dataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
├── labels/
│ ├── train/
│ ├── val/
│ └── test/
└── data.yaml
images/
目录下存放图像文件。labels/
目录下存放对应的YOLO格式的文本标注文件。data.yaml
文件定义了数据集的配置信息。
data.yaml
文件示例
# data.yaml
train: ./images/train
val: ./images/val
test: ./images/test
nc: 10 # 类别数量
names: ['person', 'rider', 'car', 'bus', 'truck', 'bike', 'motor', 'traffic light', 'traffic sign', 'train']
关键代码示例
以下是一些基本的Python代码示例,展示如何加载和查看数据集中的部分图片及其标注:
import os
import cv2
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle
def load_image_and_label(image_path, label_path):
"""
加载图片和其对应的标注信息。
Parameters:
image_path (str): 图片路径。
label_path (str): 标注文件路径。
Returns:
img (numpy.ndarray): 加载的图片。
labels (list of dict): 标注信息列表。
"""
img = cv2.imread(image_path)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 转换颜色空间
with open(label_path, 'r') as f:
lines = f.readlines()
labels = []
for line in lines:
class_id, x_center, y_center, width, height = map(float, line.strip().split())
labels.append({
'class_id': int(class_id),
'x_center': x_center,
'y_center': y_center,
'width': width,
'height': height
})
return img, labels
def draw_bounding_boxes(img, labels, class_names):
"""
在图片上绘制边界框。
Parameters:
img (numpy.ndarray): 图片。
labels (list of dict): 标注信息列表。
class_names (list of str): 类别名称列表。
"""
fig, ax = plt.subplots(1, figsize=(12, 12))
ax.imshow(img)
for label in labels:
x_center, y_center, width, height = label['x_center'], label['y_center'], label['width'], label['height']
h, w, _ = img.shape
x_min = int((x_center - width / 2) * w)
y_min = int((y_center - height / 2) * h)
x_max = int((x_center + width / 2) * w)
y_max = int((y_center + height / 2) * h)
rect = Rectangle((x_min, y_min), x_max - x_min, y_max - y_min, linewidth=2, edgecolor='r', facecolor='none')
ax.add_patch(rect)
class_name = class_names[label['class_id']]
ax.text(x_min, y_min, class_name, fontsize=12, color='red', backgroundcolor='white')
plt.axis('off')
plt.show()
if __name__ == "__main__":
data_dir = "/path/to/your/dataset"
train_images_dir = os.path.join(data_dir, "images/train")
train_labels_dir = os.path.join(data_dir, "labels/train")
# 选择任何一张训练集中的图片及其对应的标签
image_name = os.listdir(train_images_dir)[0] # 选择第一张图片
label_name = image_name.replace(".jpg", ".txt") # 假设图片是.jpg格式,标签文件名相同但扩展名为.txt
image_path = os.path.join(train_images_dir, image_name)
label_path = os.path.join(train_labels_dir, label_name)
img, labels = load_image_and_label(image_path, label_path)
print(f"Loaded image shape: {img.shape}")
print(f"Number of objects: {len(labels)}")
print(f"First object's label: {labels[0]}")
# 绘制边界框
class_names = ['person', 'rider', 'car', 'bus', 'truck', 'bike', 'motor', 'traffic light', 'traffic sign', 'train']
draw_bounding_boxes(img, labels, class_names)
请确保替换"/path/to/your/dataset"
为你本地数据集的实际路径。这段代码会加载训练集中的一张图片及其对应的标注信息,并显示带有边界框和类别的图片。你可以根据需要进一步扩展和修改这段代码,以满足更多的数据分析和模型训练需求。