一 基础知识
基于视频的目标检测任务不同于单帧图像的目标检测任务,它需要检测出视频序列的每一帧图像里的目标。由于在某些帧中的目标质量较差,包括图像模糊、遮挡等,而且形状、尺度等属性会随着目标的运动发生变化,会造成某些帧的检测结果不正确。在检测过程中最大的困难就是如何保持视频中目标的时空一致性,即时间和空间位置发生变化的目标还是属于同一个目标,这就叫做时空一致性。由于视频比静态图像多了一个时间维度上的信息,所以大多数视频目标检测算法利用该信息来增强检测性能,最常见的思路就是使用其他帧的特征来增强关键帧的预测效果。
二 GMM-高斯混合模型
2.1.混合模型
混合模型表示了观测数据在总体中的概率分布,它是一个由 K 个子分布组成的混合分布。混合模型不要求观测数据提供关于子分布的信息,来计算观测数据在总体分布中的概率。
2.2 高斯混合模型
高斯混合模型可以看作是由 K 个单高斯模型组合而成的模型,这 K 个子模型是混合模型的隐变量。高斯分布具备很好的数学性质以及良好的计算性能。
三 数学原理(暂无)
四 代码
void detectDynamicTargets(const string& videoPath) {
// 打开视频文件
VideoCapture cap(videoPath);
if (!cap.isOpened()) {
cerr << "错误:无法打开视频文件" << endl;
return;
}
// 创建背景减除器
Ptr<BackgroundSubtractorMOG2> fgbg = createBackgroundSubtractorMOG2(
500, // 历史帧数
100, // 方差阈值
false // 是否检测阴影
);
Mat frame, mask;
while (true) {
// 读取视频的每一帧
if (!cap.read(frame)) {
cerr << "错误:无法读取视频帧" << endl;
break;
}
// 应用背景减除
fgbg->apply(frame, mask, 0.01);
// 去除噪声
Mat line = getStructuringElement(MORPH_RECT, Size(1, 5), Point(-1, -1));
morphologyEx(mask, mask, MORPH_OPEN, line);
// 查找轮廓并绘制检测到的目标
vector<vector<Point>> contours;
findContours(mask, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE);
for (size_t c = 0; c < contours.size(); c++) {
double area = contourArea(contours[c]);
if (area < 150)
continue;
RotatedRect rect = minAreaRect(contours[c]);
ellipse(frame, rect, Scalar(0, 255, 0), 2, 8);
circle(frame, Point(rect.center.x, rect.center.y), 2, Scalar(255, 0, 0), 2, 8, 0);
}
// 显示结果
imshow("mask", mask);
imshow("result", frame);
// 按ESC键退出循环
char key = waitKey(50);
if (key == 27)
break;
}
destroyAllWindows();
}
五 分析代码(暂无)
5.1