MATLAB运动目标检测系统
第1章 绪论
1.1 研究背景
对于目标实施追踪一直是人们追求的目标,以前只能通过人为的或者其他信息进行模糊的追踪。20世纪初,数字图像的处理走入大众的视野。在那个时候,人们在两地之间传输了一张照片,该照片经过数字压缩后,传输时间从200多小时缩短到不足三小时。这一过程虽然用到了图像处理方面的相关知识,但计算机却没有参与到整个过程中。但是,数字图像的处理离不开一定的储存空间与计算技巧的配合,与计算机发展技术成正比关系[1]。
从20世纪50年代开始,计算机的发展才向前迈进了一大步,人们在处理图形以及图像信息时已经有意识的将计算机的功能利用起来,增加工作的便利性[2]。
从图像处理技术的兴起到20世纪70年代初这一时间段,这项技术在天文学、医学等领域被应用的较为频繁。其主要表现在,1972年,首台X射线装置的问世,也就是我们日常用于医学检查的CT,这个X射线装置主要用于头部的扫描;1975年EMT公司所研制出的X射线装置才可用于全身扫描。这项发明不仅在1979年获得了诺贝尔奖,对人类后来医学发展的贡献更是不可估量的。1972 年计算机层析仪(CT)问世,它将图像重建技术用于医学[3]。
20世纪70年代中期开始,随着时代的发展,人工智能以及计算机领域都翻开了崭新的一页,数字图像处理技术也因此而变得更加完善。人们所研究的领域也更加深入,对于目标进行追踪的技术运用也越来越普遍。本文正是基于此展开研究[6]。
1.2 研究目的和意义
卡尔曼滤波器是最优的递归算法。它可以解决很多类算法问题,使用起来非常的高效、简单,因此在实际设计的过程中运用的范围比较广。目前卡尔曼滤波主要在军事雷达领域、机器人导航领域都得到了广泛的应用。在最近的几年,它在计算机图像处理方面占据着非常重要的地位,如人脸识别,图像边缘检测与图像分割技术和操作系统等技术领域。
雷达测量系统中,目标跟踪往往是人们非常关注的方面,但测量运动目标的位置、速度和加速度在每时每刻都存在噪声信号。卡尔曼滤波是基于运动目标动态信息,设法消除噪声干扰,从而获取目标位置的最佳估计。这个估计过程主要有三个方面,第一个方面是对运动目标当前位置的估计,第二个方面是对运动目标未来位置的估计,第三个方面是对运动目标过去位置的估计。
如果需要对某一运动中的目标进行跟踪,首先需要做的是对运动目标进行跟踪观测,一般情况下得到的观测信息是不准确的,因为它包含着所需要的信息以及随机观测噪声和干扰信号。如何从这些观测信息和噪声的信号中提取所需要的数据和各种参数,因此根据预测的未来状态的观测数据和运动目标跟踪方法的关键是预测方法。卡尔曼滤波递推算法的原理是利用噪声和观测噪声以及输入和输出值进行的测量,它是具有统计特性的估计系统。主要思想是:利用前一时刻对当前时刻的预测,当前的观察值来更新对状态量的估计(得到当前时刻的最优预测值),从而求出下一时刻的预测值,实现递归的预测,达到及时准确跟踪的效果。
卡尔曼滤波作为一种数值估计优化方法,与应用领域的背景结合性很强。因此卡尔曼滤波用于解决很多实际问题时,重要的不仅仅是算法优化问题与实现,更重要的是利用获取的领域知识对被认识系统进行形式化描述,建立起合适的数学模型,再从这个模型出发,进行滤波器的设计与实现工作[9]。
因为卡尔曼滤波具有实时递推,存储容量非常小和设计起来比较简单等优点,所以卡尔曼滤波器在工程领域应用十分广泛。比如在信号处理、卫星控制、石油勘探、故障诊断、GPS定位、检测与估计、控制、通信、航空航天、制导、目标跟踪、多传感器信息融合,机器人学和生物医学领域。
1.3 国内外现状
1.3.1 国外研究现状
马里兰大学的实时监控系统W4可以基于单摄像头对人体或者人体的各个部分进行实时地跟踪。所谓W4是指,在哪里,什么人,什么时候,干什么,换句话说是指该系统可以确定什么目标,什么时候,什么地方,干什么。W4是基于身体和头部,手等功能目标形状分析,基于背景分离功能的自适应前背景分离技术,和区域分裂合并到目标的交互功能。目前,在美国,日本,欧洲已进行了大量关于运动目标检测和跟踪的研究工作,W4是一种基于视觉监控系统可以对室外运动目标进行实时检测和跟踪,而IBM等大公司资助相关的研究领域,希望能将研究成果应用于商业领域[10]。Pfinder是一款基于运动目标的颜色和形状特征使用实时追踪系统对大视角范围的运动目标进行追踪与测量的系统。同时也出现在许多国际会议与讨论小组。Pfinder系统的实现有利于帮助对室内人员的行为进行监控与行为判定。同时在交通系统中,Tai等人研究了一个视频监控系统用来交通事件检测的,可以自动检测车辆和其运行轨迹的判定。VISATRAM系统可以对每个车道的车辆行为监控,保障交通畅通Haag和Nagel专门机动车辆跟踪的问题进行了深入研究与发现,Pai等人基于十字路口的行人检测与跟踪实现行人数量统计的功能[5]。
目前,在国外一些基本的视频目标检测与追踪系统已经比较成熟了。例如,卡内基梅隆大学的视频安全和控制方案研究。根据计划,科研人员开发了一款端到端的测试系统,集成了具有许多先进视频安全监控技术,如基于静态背景和运动背景对运动目标进行实时测量与追踪,普通的目标识别(如人,汽车,卡车)分类,特殊的对象(如学校的公共汽车和有特殊标记的物体)的姿势估计和分类识别,以及和相机的独立控制,多摄像机协同跟踪人体步伐分析等[12]。
1.3.2 国内研究现状
相比之下,智能视频监控技术在国内的研究起步较晚,但随着数字图像处理技术,计算机视觉等多种红外、雷达、激光传感器技术的不断发展,运动目标检测与跟踪技术的研究提供了必要的理论基础和技术支持,创造环境的研究不可比拟的优越性。如视觉与听觉信息处理国家拥有着重点实验室,比如北京大学高智能机器感知系统实验室在三维视觉信息处理与智能机器人领域的研究取得了许多成果。
在国内的研究中也出现了一定的规模,举行了相关会议,探讨了相关的研究成果和未来的发展方向。20世纪60年代末,我国开始对视频目标检测与追踪技术进行研究,经过40多年的不懈努力与投入,我国在这一领域得到了相当大发展,许多先进的图像处理和模式识别方法应用于这一领域,同时一些实际系统的得到开发机会。中国的先进的影像识别和智能化程度,一般跟踪技术,多目标的实时测量,低对比度和复杂的视频图像信息处理与国外相比还存在较大的差距。在实际过程跟踪方面仍然存在着许多问题,如数据同步,模糊图像,跟踪稳定性差等,因为这些方面的实用信息从国外获得的很少,所以在这一领域进行了深入的研究,以提高我国的国防实力,加强公民行为起着重要的作用。目前,一些高校和科研机构都开展了这项工作[13]。
2 课题介绍
该课题为基于卡尔曼滤波的人体姿态识别,通过高斯建模,取前面若干帧图片取均值作为背景图,利用帧间差分方法进行提取人体前景轮廓,进行卡尔曼滤波的运动预测。计算每一帧图像的质心移动距离,如果移动距离超过一定阈值,则判定为行走。若质心移动小于一定的阈值,则有可能为站立或者站立的时候做其他一些动作。这时候,通过预测下一帧的运动轮廓,框出前景人体的轮廓,计算最外接矩形宽和高的比例,来判别是站立或者伸展手臂运动。