视频目标检测和静态场景抑制--GMM

最新推荐文章于 2024-07-16 09:37:48 发布

不会打代码呜呜呜呜

最新推荐文章于 2024-07-16 09:37:48 发布

阅读量273

点赞数 3

文章标签：音视频目标检测计算机视觉

本文链接：https://blog.csdn.net/huiohuoi/article/details/138357580

版权

本文介绍了视频目标检测任务的挑战，尤其是时空一致性问题。使用GMM-高斯混合模型来增强检测性能，通过背景减除和轮廓分析实现目标检测，展示了基于`detectDynamicTargets`函数的代码实例。

摘要由CSDN通过智能技术生成

一基础知识

基于视频的目标检测任务不同于单帧图像的目标检测任务，它需要检测出视频序列的每一帧图像里的目标。由于在某些帧中的目标质量较差，包括图像模糊、遮挡等，而且形状、尺度等属性会随着目标的运动发生变化，会造成某些帧的检测结果不正确。在检测过程中最大的困难就是如何保持视频中目标的时空一致性，即时间和空间位置发生变化的目标还是属于同一个目标，这就叫做时空一致性。由于视频比静态图像多了一个时间维度上的信息，所以大多数视频目标检测算法利用该信息来增强检测性能，最常见的思路就是使用其他帧的特征来增强关键帧的预测效果。

二 GMM-高斯混合模型

2.1.混合模型

混合模型表示了观测数据在总体中的概率分布，它是一个由 K 个子分布组成的混合分布。混合模型不要求观测数据提供关于子分布的信息，来计算观测数据在总体分布中的概率。

2.2 高斯混合模型

高斯混合模型可以看作是由 K 个单高斯模型组合而成的模型，这 K 个子模型是混合模型的隐变量。高斯分布具备很好的数学性质以及良好的计算性能。

三数学原理（暂无）

四代码

void detectDynamicTargets(const string& videoPath) {
    // 打开视频文件
    VideoCapture cap(videoPath);

    if (!cap.isOpened()) {
        cerr << "错误：无法打开视频文件" << endl;
        return;
    }

    // 创建背景减除器
    Ptr<BackgroundSubtractorMOG2> fgbg = createBackgroundSubtractorMOG2(
        500, // 历史帧数
        100, // 方差阈值
        false // 是否检测阴影
    );

    Mat frame, mask;
    while (true) {
        // 读取视频的每一帧
        if (!cap.read(frame)) {
            cerr << "错误：无法读取视频帧" << endl;
            break;
        }

        // 应用背景减除
        fgbg->apply(frame, mask, 0.01);

        // 去除噪声
        Mat line = getStructuringElement(MORPH_RECT, Size(1, 5), Point(-1, -1));
        morphologyEx(mask, mask, MORPH_OPEN, line);

        // 查找轮廓并绘制检测到的目标
        vector<vector<Point>> contours;
        findContours(mask, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE);
        for (size_t c = 0; c < contours.size(); c++) {
            double area = contourArea(contours[c]);
            if (area < 150)
                continue;
            RotatedRect rect = minAreaRect(contours[c]);
            ellipse(frame, rect, Scalar(0, 255, 0), 2, 8);
            circle(frame, Point(rect.center.x, rect.center.y), 2, Scalar(255, 0, 0), 2, 8, 0);
        }

        // 显示结果
        imshow("mask", mask);
        imshow("result", frame);

        // 按ESC键退出循环
        char key = waitKey(50);
        if (key == 27)
            break;
    }

    destroyAllWindows();
}