与文本结合的近邻相似视频检索

本文档介绍了视频检索的全部流程,
整体流程:
1.视频图像切成相应的视频帧(图像片段)
2.文本筛选
3.提取相应的sift特征点
4.建立视觉词典
5.视觉词典的量化以及索引建立
6.实现视频检索
7.实验结论
附录1:paper:Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search组织结构
附录2:文档及资源提供
附录3:平台环境 
下面详细阐述相应的视频检索步骤,并将我实验的相应过程记录于此
1.视频图像切成相应的视频帧(图像片段)(特别注解:拿到我手里的数据集是已经抽好的视频帧)
视频是由相应的连续的图像片段组成,这里我们(注解:抽帧核心代码copy from teacher chen)写了相应的代码(“抽取视频帧.exe”)用于抽取图像的视频帧,对应的格式实例为:Shot1_48_KF.jpg其中第二个字段表明是对应视频的多少帧
2.文本筛选
相对应的视频文件数据集给我提供了相应的文本文件,如:

这里包含了视频的相应文本信息(标题时间,发生地点,任务,时间等关键词),这里我应用了三个文本文件来进行数据集的筛选,我就一下11个topics进行了相应的筛选,
1) bush shoe; 04-12-2008; 前后一个月
2) Obama inauguration; 20-01-2009; 前后一个月
3) Susan Boyle; 15-04-2009;前后一个月
4) Amanda Holden; 16-04-2009; 前后一个月
5) Michael Jackson; 27-06-2009; 前后两个月
6) cenk uygur; 12-08-2009; 无时间限制
7) Lady Gaga poker; 19-02-2009;无时间限制
8) Silvio Berlusconi; 14-12-2009; 前后两个月
9) brad pitt; 23-02-2009; 前后两个月
10) lauren luke; 16-04-2009; 无时间限制
11) Miley Cyrus; 08-12-2008; 前后一个月
对应这个过程我写了相应的文本筛选代码“F:\工作-以时间记\成型性质代码\20150608work-文本筛选\20150608work.exe”,对应的数据结构如图:

对应的一个输出结果如图:

3.提取相应的sift特征点
第二步骤的完成使得我们缩小了提取图像片段的sift特征点的数据集,下面我们就此数据集进行相应的sift特征点的提取。
这里我用的是CityU的局部特征提取程序lip-viero.exe,该toolkit可以到CityU的官网上面去下载,也存于本机的F:\重要工具\sotu_1_05
文件夹当中
提取sift特征点的命令如下:F:\重要工具\Release\lip-vireo -dir F:\ -d harlap -p sift -dsdir F:\工作-以时间记

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值