视频特征提取demo

最新推荐文章于 2024-08-07 18:07:53 发布

sl_950313

最新推荐文章于 2024-08-07 18:07:53 发布

阅读量8.4k

点赞数

本文链接：https://blog.csdn.net/sl_950313/article/details/79156566

版权

本文介绍了如何使用C3D模型从原始视频文件中提取特征，通过简单的命令完成特征提取并存储在levelDB中。尽管已成功提取特征，但如何将这些数据应用于video-caption模型仍需进一步研究。后续发现，使用Caffe Zoo的Sequence To Sequence模型能更有效地实现视频转文字功能。

摘要由CSDN通过智能技术生成

背景

因为做目前的video-caption都只是根据已经有的视频特征数据来进行描述的生成，所以我们需要对于一个原生的视频文件生成特征。调研的一个方法是使用C3D的feature-extract

步骤

步骤很简单，几个简单的命令就解决问题了，中间也没有出啥错误，但是也是要参考caffe的安装方法。

git clone https://github.com/facebook/C3D/tree/master/C3D-v1.1
mv Makefile.config.example Makefile.config
make all -j20

之后就可以用build下面的各种工具了。我用的是extract_features.bin其实都是参照的C3D中的README，最后用这条命令./build/tools/extract_features.bin models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel examples/_temp/imagenet_val.prototxt fc7 examples/_temp/features 10 leveldb跑出来了一个存放在levelDB里面的数据。简单的写了个python读取了一下里面的数据。里面是key-value数据，