背景
因为做目前的video-caption都只是根据已经有的视频特征数据来进行描述的生成,所以我们需要对于一个原生的视频文件生成特征。调研的一个方法是使用C3D的feature-extract
步骤
步骤很简单,几个简单的命令就解决问题了,中间也没有出啥错误,但是也是要参考caffe的安装方法。
git clone https://github.com/facebook/C3D/tree/master/C3D-v1.1
mv Makefile.config.example Makefile.config
make all -j20
之后就可以用build下面的各种工具了。我用的是extract_features.bin
其实都是参照的C3D中的README,最后用这条命令./build/tools/extract_features.bin models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel examples/_temp/imagenet_val.prototxt fc7 examples/_temp/features 10 leveldb
跑出来了一个存放在levelDB里面的数据。简单的写了个python读取了一下里面的数据。里面是key-value数据,