与文本结合的近邻相似视频检索

最新推荐文章于 2024-04-17 09:54:08 发布

judewen_hi

最新推荐文章于 2024-04-17 09:54:08 发布

阅读量1.1k

点赞数

分类专栏：图像视频文章标签：词袋模型视频检索流程

本文链接：https://blog.csdn.net/u010598982/article/details/50770869

版权

本文档介绍了视频检索的全部流程，
整体流程：
1.视频图像切成相应的视频帧（图像片段）
2.文本筛选
3.提取相应的sift特征点
4.建立视觉词典
5.视觉词典的量化以及索引建立
6.实现视频检索
7.实验结论
附录1：paper：Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search组织结构
附录2：文档及资源提供
附录3：平台环境
下面详细阐述相应的视频检索步骤，并将我实验的相应过程记录于此
1.视频图像切成相应的视频帧（图像片段）（特别注解：拿到我手里的数据集是已经抽好的视频帧）
视频是由相应的连续的图像片段组成，这里我们（注解：抽帧核心代码copy from teacher chen）写了相应的代码（“抽取视频帧.exe”）用于抽取图像的视频帧，对应的格式实例为：Shot1_48_KF.jpg其中第二个字段表明是对应视频的多少帧
2.文本筛选
相对应的视频文件数据集给我提供了相应的文本文件，如：

这里包含了视频的相应文本信息（标题时间，发生地点，任务，时间等关键词），这里我应用了三个文本文件来进行数据集的筛选,我就一下11个topics进行了相应的筛选，
1) bush shoe; 04-12-2008; 前后一个月
2) Obama inauguration; 20-01-2009; 前后一个月
3) Susan Boyle; 15-04-2009;前后一个月
4) Amanda Holden; 16-04-2009; 前后一个月
5) Michael Jackson; 27-06-2009; 前后两个月
6) cenk uygur; 12-08-2009; 无时间限制
7) Lady Gaga poker; 19-02-2009;无时间限制
8) Silvio Berlusconi; 14-12-2009; 前后两个月
9) brad pitt; 23-02-2009; 前后两个月
10) lauren luke; 16-04-2009; 无时间限制
11) Miley Cyrus; 08-12-2008; 前后一个月
对应这个过程我写了相应的文本筛选代码“F:\工作-以时间记\成型性质代码\20150608work-文本筛选\20150608work.exe”，对应的数据结构如图：

对应的一个输出结果如图：

3.提取相应的sift特征点
第二步骤的完成使得我们缩小了提取图像片段的sift特征点的数据集，下面我们就此数据集进行相应的sift特征点的提取。
这里我用的是CityU的局部特征提取程序lip-viero.exe,该toolkit可以到CityU的官网上面去下载，也存于本机的F:\重要工具\sotu_1_05
文件夹当中
提取sift特征点的命令如下：F:\重要工具\Release\lip-vireo -dir F:\ -d harlap -p sift -dsdir F:\工作-以时间记

最低0.47元/天解锁文章

judewen_hi

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
与文本结合的近邻相似视频检索

本文档介绍了视频检索的全部流程，整体流程： 1.视频图像切成相应的视频帧（图像片段） 2.文本筛选 3.提取相应的sift特征点 4.建立视觉词典 5.视觉词典的量化以及索引建立 6.实现视频检索 7.实验结论附录1：paper：Hamming Embedding and Weak Geometric Consistency for Large Scale Image Sear
复制链接

扫一扫