基于深度学习的停车位检测系统(UI界面+YOLOv8/v7/v6/v5代码+训练数据集)
引言
停车位检测在智能交通系统和智慧城市建设中扮演着重要角色。通过自动检测停车位的使用情况,可以有效提高停车管理效率,减少因停车问题引发的交通拥堵。本文将介绍如何构建一个基于深度学习的停车位检测系统,详细说明环境搭建、数据准备、模型训练、系统实现和用户界面设计等步骤。
系统概述
本系统的实现流程如下:
- 环境搭建
- 数据收集与处理
- 模型训练
- 系统实现
- 用户界面设计
环境搭建
首先,需要搭建一个适合深度学习的开发环境。本文使用Python 3.8或以上版本,并依赖于多个深度学习和图像处理库。
安装必要的库
使用以下命令安装所需库:
pip install numpy pandas matplotlib opencv-python torch torchvision ultralytics pyqt5
数据收集与处理
数据收集
收集包含停车场及其停车位的图像数据集,可以从公开的停车位数据集下载,或者通过摄像头自行采集。确保数据集包含不同角度、不同光照条件下的停车位图像。
数据处理
将图像数据整理到指定的文件夹结构,并标注停车位的位置。以下是示例的文件夹结构:
datasets/
├── images/
│ ├── train/
│ │ ├── image1.jpg
│ │ ├── image2.jpg
│ ├── val/
│ │ ├── image1.jpg
│ │ ├── image2.jpg
├── labels/
├── train/
│ ├── image1.txt
│ ├── image2.txt
├── val/
├── image1.txt
├── image2.txt
每个标签文件的内容如下:
class x_center y_center width height
其中,class
表示类别编号,x_center
、y_center
为归一化后的中心坐标,width
和height
为归一化后的宽度和高度。
模型训练
使用YOLO模型进行训练。
配置文件
创建一个配置文件config.yaml
:
path: datasets
train: images/train
val: images/val
test: images/test
nc: 1 # 类别数
names: ['parking_space']
训练代码
使用以下代码训练模型:
from ultralytics import YOLO
# 加载模型
model = YOLO('yolov8n.pt')
# 训练模型
model.train(data='config.yaml', epochs=50, imgsz=640, batch=16, lr0=0.01)
系统实现
训练好的模型可以用于实时停车位检测。使用OpenCV读取视频流,并调用YOLO模型进行检测。
检测代码
import cv2
from ultralytics import YOLO
# 加载训练好的模型
model = YOLO('best.pt')
# 打开视频流
cap = cv2.VideoCapture('parking_lot_video.mp4')
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
# 检测停车位
results = model(frame)
for result in results:
bbox = result['bbox']
label = result['label']
confidence = result['confidence']
# 画框和标签
cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
# 显示结果
cv2.imshow('Parking Space Detection', frame)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
用户界面设计
为了提高系统的易用性,我们设计了一个用户友好的界面。使用PyQt5实现用户界面,提供图像或视频播放和停车位检测结果显示。
界面代码
以下是一个简单的PyQt5界面代码示例:
import sys
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QLabel, QPushButton, QFileDialog
from PyQt5.QtGui import QPixmap, QImage
import cv2
from ultralytics import YOLO
class ParkingSpaceDetectionUI(QWidget):
def __init__(self):
super().__init__()
self.initUI()
self.model = YOLO('best.pt')
def initUI(self):
self.setWindowTitle('Parking Space Detection System')
self.layout = QVBoxLayout()
self.label = QLabel(self)
self.layout.addWidget(self.label)
self.button = QPushButton('Open Image or Video', self)
self.button.clicked.connect(self.open_file)
self.layout.addWidget(self.button)
self.setLayout(self.layout)
def open_file(self):
options = QFileDialog.Options()
file_path, _ = QFileDialog.getOpenFileName(self, "Open File", "", "All Files (*);;MP4 Files (*.mp4);;JPEG Files (*.jpg);;PNG Files (*.png)", options=options)
if file_path:
if file_path.endswith('.mp4'):
self.detect_parking_space_video(file_path)
else:
self.detect_parking_space_image(file_path)
def detect_parking_space_image(self, file_path):
frame = cv2.imread(file_path)
results = self.model(frame)
for result in results:
bbox = result['bbox']
label = result['label']
confidence = result['confidence']
cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
height, width, channel = frame.shape
bytesPerLine = 3 * width
qImg = QImage(frame.data, width, height, bytesPerLine, QImage.Format_RGB888).rgbSwapped()
self.label.setPixmap(QPixmap.fromImage(qImg))
def detect_parking_space_video(self, file_path):
cap = cv2.VideoCapture(file_path)
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
# 检测停车位
results = self.model(frame)
for result in results:
bbox = result['bbox']
label = result['label']
confidence = result['confidence']
# 画框和标签
cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
height, width, channel = frame.shape
bytesPerLine = 3 * width
qImg = QImage(frame.data, width, height, bytesPerLine, QImage.Format_RGB888).rgbSwapped()
self.label.setPixmap(QPixmap.fromImage(qImg))
cv2.waitKey(1)
cap.release()
if __name__ == '__main__':
app = QApplication(sys.argv)
ex = ParkingSpaceDetectionUI()
ex.show()
sys.exit(app.exec_())
上述代码实现了一个简单的PyQt5界面,用户可以通过界面打开图片或视频文件,并实时查看停车位检测结果。
进一步优化
为了进一步提升系统性能,可以在以下几个方面进行优化:
数据增强
通过数据增强技术,可以增加训练数据的多样性,从而提高模型的泛化能力。例如,可以对图像进行随机裁剪、旋转、翻转等操作。
from torchvision import transforms
data_transforms = {
'train': transforms.Compose([
transforms.RandomResizedCrop(224),
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
'val': transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
}
模型调优
可以尝试不同的YOLO模型(如YOLOv5、YOLOv6、YOLOv7、YOLOv8),并调整模型的超参数,如学习率、批量大小、训练轮数等,以获得最佳性能。
部署优化
在实际部署中,可以使用TensorRT等工具对模型进行优化,以提高推理速度和效率。
总结与声明
本文详细介绍了如何构建一个基于深度学习的停车位检测系统。从环境搭建、数据收集与处理、模型训练、系统实现到用户界面设计,提供了完整的实现步骤和代码示例。
声明:本文只是简单的项目思路,如有部署的想法,想要(UI界面+YOLOv8/v7/v6/v5代码+训练数据集)的可以联系作者.