相关滤波之开篇Mosse原理及代码详解

最新推荐文章于 2021-04-11 22:16:50 发布

Joker-lay

最新推荐文章于 2021-04-11 22:16:50 发布

阅读量5.7k

点赞数 26

分类专栏：相关滤波文章标签：目标跟踪计算机视觉相关滤波 mosse算法

本文链接：https://blog.csdn.net/qq_22905795/article/details/97272882

版权

代码解读

接下来分别介绍下各个具体模块的代码首先是主程序demo.py

from mosse import mosse
import argparse

parse = argparse.ArgumentParser()
parse.add_argument('--lr', type=float, default=0.125, help='the learning rate')
parse.add_argument('--sigma', type=float, default=100, help='the sigma')
parse.add_argument('--num_pretrain', type=int, default=128, help='the number of pretrain')
parse.add_argument('--rotate', action='store_true', help='if rotate image during pre-training.')
parse.add_argument('--record', action='store_true', help='record the frames')

if __name__ == '__main__':
    args = parse.parse_args()
    img_path = 'datasets/surfer/'

    tracker = mosse(args, img_path)
    tracker.start_tracking()

其中下半部分为主程序，进行参数的赋值，图像路径的赋值，跟踪器的设计，开始跟踪
上半部分为参数的赋值，为python自带模块argparse 的使用。

其次是
mosse.py
这里定义了一个mosse类用于mosse算法的实现
主要就是一个方法

    def start_tracking(self):
        # 得到图像的第一帧
        init_img = cv2.imread(self.frame_lists[0])
        init_frame = cv2.cvtColor(init_img, cv2.COLOR_BGR2GRAY)
        init_frame = init_frame.astype(np.float32)
        # 在第一帧中框选中需要的目标区域
        init_gt = cv2.selectROI('demo', init_img, False, False)
        init_gt = np.array(init_gt).astype(np.int64)
        # 得到当前的高斯响应
        response_map = self._get_gauss_response(init_frame, init_gt)
   
        # 得到目标图像大小的高斯响应图
        g = response_map[init_gt[1]:init_gt[1]+init_gt[3], init_gt[0]:init_gt[0]+init_gt[2]]
        #原始图像
        fi = init_frame[init_gt[1]:init_gt[1]+init_gt[3], init_gt[0]:init_gt[0]+init_gt[2]]
        #进行傅里叶变换
        G = np.fft.fft2(g)
        # 预处理
        Ai, Bi = self._pre_training(fi, G)
        # 开始跟踪
        for idx in range(len(self.frame_lists)):
            current_frame = cv2.imread(self.frame_lists[idx])
            frame_gray = cv2.cvtColor(current_frame, cv2.COLOR_BGR2GRAY)
            frame_gray = frame_gray.astype(np.float32)
            if idx == 0:
                Ai = self.args.lr * Ai
                Bi = self.args.lr * Bi
                pos = init_gt.copy()
                clip_pos = np.array([pos[0], pos[1], pos[0]+pos[2], pos[1]+pos[3]]).astype(np.int64)
            else:
                Hi = Ai / Bi
                fi = frame_gray[clip_pos[1]:clip_pos[3], clip_pos[0]:clip_pos[2]]
                fi = pre_process(cv2.resize(fi, (init_gt[2], init_gt[3])))
                Gi = Hi * np.fft.fft2(fi)
                gi = linear_mapping(np.fft.ifft2(Gi))
                # 找到最大的响应点，这就是第二帧的目标位置
                max_value = np.max(gi)
                max_pos = np.where(gi == max_value)
                dy = int(np.mean(max_pos[0]) - gi.shape[0] / 2)
                dx = int(np.mean(max_pos[1]) - gi.shape[1] / 2)
                
                # 更新位置信息
                pos[0] = pos[0] + dx
                pos[1] = pos[1] + dy

                # trying to get the clipped position [xmin, ymin, xmax, ymax]
                clip_pos[0] = np.clip(pos[0], 0, current_frame.shape[1])
                clip_pos[1] = np.clip(pos[1], 0, current_frame.shape[0])
                clip_pos[2] = np.clip(pos[0]+pos[2], 0, current_frame.shape[1])
                clip_pos[3] = np.clip(pos[1]+pos[3], 0, current_frame.shape[0])
                clip_pos = clip_pos.astype(np.int64)

                # get the current fi..
                fi = frame_gray[clip_pos[1]:clip_pos[3], clip_pos[0]:clip_pos[2]]
                fi = pre_process(cv2.resize(fi, (init_gt[2], init_gt[3])))
                # online update...
                Ai = self.args.lr * (G * np.conjugate(np.fft.fft2(fi))) + (1 - self.args.lr) * Ai
                Bi = self.args.lr * (np.fft.fft2(fi) * np.conjugate(np.fft.fft2(fi))) + (1 - self.args.lr) * Bi
            
            #可视化跟踪序列图像
            cv2.rectangle(current_frame, (pos[0], pos[1]), (pos[0]+pos[2], pos[1]+pos[3]), (255, 0, 0), 2)
            cv2.imshow('demo', current_frame)
            cv2.waitKey(100)
            # if record... save the frames..
            if self.args.record:
                frame_path = 'record_frames/' + self.img_path.split('/')[1] + '/'
                if not os.path.exists(frame_path):
                    os.mkdir(frame_path)
                cv2.imwrite(frame_path + str(idx).zfill(5) + '.png', current_frame)

整个流程基本与mosse算法原理一致，对照着原理，把这个推导一遍，会更加好理解这个算法基本原理

utils.py里面主要就是对图像进行一些预处理比如图像线性映射，进行点乘余弦窗处理，使图像边缘慢慢变成零，图像反转操作等。

程序框图

以上就是整个mosse算法的原理及代码流程，最后附上一张流程框图，结合去看，会理解的更加深入。
mosse代码流程图
先写到这里，第一次写博客，很多不是很完善，之后慢慢改。。

Joker-lay

关注

26
点赞
踩
103

收藏

觉得还不错? 一键收藏
2
评论
相关滤波之开篇Mosse原理及代码详解

相关滤波之开篇Mosse原理及代码详解相关滤波（Correlation Filter ）介绍本文主要介绍相关滤波算法开篇——mosse具体原理及其python代码实现流程相关滤波（Correlation Filter ）介绍相关滤波（CF）源于信号处理领域，有这么一句话“两个信号越相似，其相关值越高。在跟踪，就是找到与跟踪目标响应最大的项” 贯穿了整个相关滤波算法的根本。2010年CVPR...
复制链接

扫一扫