Opencv学习笔记(二)meanshift之我见

       

         今天看到了opencv cookbook一书的第四章,看到了meanshift这个概念。其实以前也看到过这个概念,知道可以用meanshift来做目标跟踪和图像分割。但那时候只知道这个东西叫做均值漂移,并不知道它是怎么做图像分割的。冥冥之中感觉这玩意儿对我现在写的论文有帮助,今天对着Dorin Comaniciu 等人2002年写的《Mean Shift:A Robust Approach Toward Feature Space Analysis》研究了一下,大致理清了它的概念。

        公式就不写了。meanshift其实原理挺简单的,就是随便找个种子点,然后开始在该种子点邻域内寻找其目标点的密度中心,那么种子点到密度中心点的向量方向就是密度上升方向了,更新密度中心点为种子点,迭代,直到到达截止条件(opencv里的meanshift把截止条件定为迭代次数和截止精度,当然这两者可以随意组合)。

        改进的meanshift使用了核函数(区别种子点附近和远处点的权重)和权重系数(区别不同样本的权重),但基本原理还是一样的。

        这篇论文很长,但作为牛逼的论文嘛,在实现该方法的同时,它系统地证明了meanshift算法是沿着最大密度梯度方向搜索的,并且随着多次迭代,种子点趋于稳定。

        其实在上面讲述的时候去掉了一个背景,就是所有样本都采样自概率密度函数,但这并不影响理解其原理。

        

        通过分析meanshift的原理,其目的就是寻找的是局部最优点,这样很容易联想到其在图像分割或聚类上的应用。

        对于其应用到图像处理上来,其样本可认为是(x,y),x值二维坐标,y是颜色空间(p维,maybe  1or3),那么总维数是      p+2。

         meanshift也可用作图像平滑,但是对每一个像素点操作用迭代截止值代替,算法复杂度肯定很高了。

         目前用meanshift的很多其实还是目标跟踪,先预先取一个目标矩形框,在目标动的时候,就会迭代更新密度中心点到当前目标的密度中心,这样只是一个固定的矩形框的局部范围搜索,算法复杂度肯定可以接受,实时性就不错了。但是通过分析发现用meanshift做跟踪的话,目标突然消失又突然出现,这个算法肯定傻逼了,所以换句话说,目标必须连续移动。

        好吧,其实我最初是想做一幅复杂背景图片里的前景区域(可能有很多颜色和前景类似物体,但假定它们的size比前景物体要小很多)的提取,该算法的局部收敛让我很郁闷,谁能给我个好的建议啊,感激不尽啊!!!



  • 12
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
好的,我可以帮你解答关于使用OpenCV的Python库进行行人跟踪的问题。 首先,我们需要安装OpenCV库。你可以通过以下命令使用pip进行安装: ``` pip install opencv-python ``` 接下来,我们将使用Meanshift算法进行行人跟踪。Meanshift算法是一种基于颜色直方图的跟踪算法,它可以追踪物体在图像中的位置。 下面是一个简单的Python代码示例,演示如何使用Meanshift算法进行行人跟踪: ```python import cv2 # 读取视频文件 cap = cv2.VideoCapture('pedestrians.mp4') # 读取第一帧 ret, frame = cap.read() # 定义感兴趣区域(ROI) x, y, w, h = 300, 200, 100, 100 track_window = (x, y, w, h) # 提取感兴趣区域(ROI)的直方图 roi = frame[y:y+h, x:x+w] hsv_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV) roi_hist = cv2.calcHist([hsv_roi], [0], None, [180], [0,180]) cv2.normalize(roi_hist, roi_hist, 0, 255, cv2.NORM_MINMAX) # 定义Meanshift参数 term_crit = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1) while True: ret, frame = cap.read() if ret == True: # 将当前帧转换为HSV颜色空间 hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) # 计算反向投影 dst = cv2.calcBackProject([hsv], [0], roi_hist, [0, 180], 1) # 应用Meanshift算法获取新的位置 ret, track_window = cv2.meanShift(dst, track_window, term_crit) # 绘制跟踪目标的区域 x, y, w, h = track_window img2 = cv2.rectangle(frame, (x, y), (x+w, y+h), 255, 2) cv2.imshow('img2', img2) # 按下 'q' 键退出 if cv2.waitKey(60) & 0xFF == ord('q'): break else: break cap.release() cv2.destroyAllWindows() ``` 在上面的代码中,我们首先读取视频文件,并读取第一帧。我们选择感兴趣区域(ROI),并提取其直方图。然后,我们应用Meanshift算法追踪该区域,并在每个帧中绘制跟踪目标的矩形。 注意,我们还应该定义一个退出条件,以确保程序在跟踪结束后正常退出。 希望这个示例能帮助你理解如何使用OpenCV的Python库进行行人跟踪。如果你有任何其他问题,请随时问我。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值