video retrieval
cheetah023
这个作者很懒,什么都没留下…
展开
-
lmdb高效存储图片数据
最近在做预训练的时候,需要从视频中提取图片,然后保存在lmdb数据库中。但是直接储存图片数据会占用很大的内存,所以存储的时候,需要先将图片编码压缩之后,再存储到lmdb数据库;读取的时候,需要读取出来之后再解压缩。参考:Write jpeg file directly to lmdb [closed] - 码农岛可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试):问题:Imanagedtowritenumpyarraystolmdb,howewersolu原创 2022-03-01 12:25:39 · 2191 阅读 · 0 评论 -
Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual Softmax Loss 阅读笔记
要点总结:1、Dual Softmax lossDual Softmax loss是先对M1使用按列的softmax,得到M2(相当于考虑Video2text的相似度权重),M1再和M2按对应元素相乘得到M4,再对M4进行按行的softmax,得到M5,这样得到的相似矩阵M5和原始的相似矩阵M3相比,准确度会更高...原创 2021-09-28 22:48:05 · 846 阅读 · 0 评论