OpenCV-光流估计

红米煮粥

已于 2024-10-11 21:32:19 修改

阅读量298

点赞数 11

文章标签： opencv 人工智能计算机视觉

于 2024-10-11 21:28:54 首次发布

本文链接：https://blog.csdn.net/2301_77698138/article/details/142863438

版权

文章目录

一、光流估计介绍
二、代码实现
三、注意事项

OpenCV中的光流估计是计算机视觉领域中的一项重要技术，它通过分析图像序列中像素点的运动，来估计物体的运动信息。以下是对OpenCV中光流估计的详细解析：

一、光流估计介绍

1.光流估计的基本概念

光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”。具体来说，当给定两帧图像时，光流估计旨在找出上一帧图像中的每一个点在下一帧图像中的位置变化，即这些点移动到了什么位置。这个过程可以用来对图像进行动态分析，如目标跟踪等。

2.光流估计的原理

光流估计的基本思想是，如果两帧图像中的某个像素点的强度发生了变化，那么这个像素点可能是由于物体的运动引起的。因此，光流估计的目标是找到每个像素点的位移矢量，以表示其运动方向和速度。

为了实现这一目标，需要基于一些假设，如亮度恒定（同一点随着时间的变化，其亮度不会发生改变）、小运动（随着时间的变化不会引起位置的剧烈变化）和空间一致（一个场景上邻近的点投影到图像上也是邻近点，且邻近点速度一致）等。这些假设有助于构建光流估计的数学模型，并通过求解该模型来得到光流场。

3.光流估计的前提

（1）亮度恒定：同一点随着时间的变化，其亮度不会发生改变。
（2）小运动：随着时间的变化不会引起位置的剧烈变化，只有小运动情况下才能用前后帧之间单位位置变化引起的灰度变化去近似灰度对位置的偏导数。
（3）空间一致：一个场景上邻近的点投影到图像上也是邻近点，且邻近点速度一致。因为光流法基本方程约束只有一个，而要求x，y方向的速度，有两个未知变量。所以需要连立n多个方程求解。

4.OpenCV中的光流估计算法

OpenCV提供了多种光流估计算法，其中常见的有Lucas-Kanade法和Farneback法。

Lucas-Kanade法：

假设图像中的像素在一个小的时间窗口内的运动是一个刚体的平移运动。
使用稀疏光流方法，即只计算一些特征点（如角点）的光流。
可以通过设置搜索窗口大小、金字塔层数等参数来调整算法的性能。

Farneback法：

通过对图像进行多尺度处理，计算像素在时间上的运动。
使用稠密光流方法，即计算整个图像的光流场。
适用于需要精确估计整个图像运动的情况。

5.参数设置与调整

在进行光流估计时，需要设置一些参数来控制算法的性能。这些参数包括最大/最小光流值、阈值、窗口大小和迭代次数等。

最大/最小光流值：表示像素点在相邻帧之间可以移动的最大/最小距离。这些值可以根据实际场景进行调整。
阈值：用于控制算法的灵敏度。当光流值大于阈值时，认为该像素点是前景目标；当光流值小于等于阈值时，认为该像素点是背景。
窗口大小：用于控制算法的局部性。窗口大小越大，算法考虑的局部信息越多，但计算量也越大；窗口大小越小，算法考虑的局部信息越少，但计算量也越小。
迭代次数：在一些光流估计算法中，需要进行迭代计算才能得到最终的光流值。迭代次数越多，计算量越大，但光流值的精度也可能越高。

二、代码实现

以下是运用Lucas-Kanade法进行光流估计的代码，我们对其进行逐一讲解，并为其注释，以便大家更好的理解代码。

import numpy as np
import cv2

# 创建了一个 VideoCapture 对象，用于从视频文件 'test.avi' 中读取帧。
cap = cv2.VideoCapture('test.avi')
# 生成一个 100x3 的数组，包含随机整数，范围从 0 到 255。这些整数代表 RGB 颜色值，用于绘制轨迹
color = np.random.randint(0, 255, (100, 3))
# 读取视频的第一帧，ret 是一个布尔值，表示是否成功读取。
ret, old_frame = cap.read()
# 将第一帧从 BGR 转换为灰度图像，因为光流算法通常在灰度图像上运行
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)
# 定义特征点检测参数
feature_params = dict(maxCorners=100,  # 最大角点数量
                      qualityLevel=0.3,  # 角点质量的阚值
                      minDistance=7)  # 最小距离，用于分散角点
# 在第一帧的灰度图像上检测特征点
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)  # **:关键字参数解包,用于将字典解包为关键字参数,
# 创建一个与当前帧大小相同的全零掩模，用于绘制轨迹
mask = np.zeros_like(old_frame)
# 定义Lucas-Kanade光流参数
lk_params = dict(winSize=(15, 15),  # 窗口大小
                 maxLevel=2)  # 金字塔层数
# 主循环，处理视频的每一帧
while (True):
    # 读取下一帧
    ret, frame = cap.read()
    # 检查是否成功读取到帧
    if not ret:
        break

    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
	# 使用 Lucas-Kanade 方法计算从上一帧到当前帧的光流。
    p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)
	# 筛选有效特征点,st 是一个状态数组，st == 1 表示成功找到对应点的特征点。
    good_new = p1[st == 1]
    good_old = p0[st == 1]
    # 绘制轨迹
    for i, (new, old) in enumerate(zip(good_new, good_old)):
        a, b = new.ravel()
        c, d = old.ravel()
        a, b, c, d = int(a), int(b), int(c), int(d)
        # 在掩膜上绘制线段，连接新点和旧点
        mask = cv2.line(mask, (a, b), (c, d), color[i].tolist(), 2)
        cv2.imshow('mask', mask)

    # 将掩膜添加到当前帧
    img = cv2.add(frame, mask)

    cv2.imshow('frame', img)
    # 等待150毫秒，检测是否按下ESC键
    k = cv2.waitKey(150) & 0xff
    if k == 27:
        break
    # 更新旧灰度图和就特征点
    old_gray = frame_gray.copy()
    p0 = good_new.reshape(-1, 1, 2)  # 重新整理特征点

cv2.destroyAllWindows()
cap.release()