motion estimation

运动估计是视频压缩中的关键技术,通过比较图像序列中宏块与参考帧的匹配程度来估算运动矢量。常用匹配准则包括MAD、MSE和NCCF,其中SAD应用广泛。全搜索法精度高但计算复杂,因此需要快速算法,如分层、多分辨率、连续消除等。H264标准引入多参考帧、1/4像素预测精度和多块尺寸等特性。本文用MATLAB实现了一个全搜索法的例子。
摘要由CSDN通过智能技术生成

运动估计:基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有像素的位移量都是相同,然后对每个宏块内到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相思的块,即匹配块,匹配块与当前快的相对位移即为运动矢量。视频压缩的时候只需要保存运动矢量和残差数据就可以完全恢复当前块。

常见的运动估计匹配准则有三种:MAD、MSE和NCCF,由于MAD没有乘除操作,不需要做乘法运算,实现简单方便,所以使用比较多,通常使用求和绝对误差(SAD)代替MAD





全搜索法:对搜索区域的所有位置进行穷尽搜索 精度最高 计算复杂难以实时处理 必须研究相应的运动估计快速算法


运动估计快速算法分类:分层的和多分辨率的快速匹配算法 基于连续消除的快速匹配算法 基于像素子抽样的快速匹配算法 固定搜索模式的快速匹配算法 基于时空相关项和视觉也行的匹配算法



固定模式法:该方法假设匹配误差随着离全局误差最小点的距离增加而单调增加 一般从原点开始 采用固定的搜索模板和搜索策略得到最佳匹配块,著名的大算法有三步法 梯度下降法 四步法 菱形法 六变形法


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
def get_parser(): parser = argparse.ArgumentParser(description='Face detection and classification for politicians in Japanese TV.') # Important configuration variables parser.add_argument('--dataset', type=str, default='mot17', help='Mode name for saving files.') parser.add_argument('--mode', default='train', type=str, help='train or test.') parser.add_argument('--detector', type=str, default='YOLOX', help='Detector to be used. FRCNN, SDP, Bresee, SGT, YOLOX, GT.') parser.add_argument('--reid', type=str, default=None, help='Reidentification model to be used. SBS, MGN.') parser.add_argument('--mod', type=str, default=None, help='Tracker name modifier to do testing of features.') # Paths parser.add_argument('--datapath', type=str, default='datasets/MOT17Det', help='Dataset path with frames inside.') parser.add_argument('--feat', type=str, default='feats', help='Features files path.') # Tracking-specific configuration variables parser.add_argument('--max_iou_th', type=float, default=0.15, help='Max value to multiply the distance of two close objects.') parser.add_argument('--w_tracklet', type=int, default=10, help='Window size per tracklet') parser.add_argument('--w_fuse', type=int, default=3, help='Window size per fusion in hierarchy') parser.add_argument('--max_prop', type=int, default=10000, help='Difficult the fusion when the frame difference is larger than this value.') parser.add_argument('--fps_ratio', type=int, default=1, help='Use lower fps dataset if lower than 1.') # Flags parser.add_argument('--save_feats', action='store_true', help='Save tracking + feature vectors as pkl file for analysis.') parser.add_argument('--iou', action='store_true', help='Add IoU distance to further improve the tracker.') parser.add_argument('--temp', action='store_true', help='Use temporal distance to further improve the tracker.') parser.add_argument('--spatial', action='store_true', help='Use spatial distance to further improve the tracker.') parser.add_argument('--motion', action='store_true', help='Add motion estimation to further improve the tracker.') parser.add_argument('--randorder', action='store_true', help='Random order of lifted frames for testing.') parser.add_argument('--noncont', action='store_true', help='Do not enforce continuous clustering. Allow all tracklets to cluster with whoever they want.') return parser
06-01
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值