数据
岳额不到五
这个作者很懒,什么都没留下…
展开
-
Condensed Movies: Story Based Retrieval with Contextual Embeddings
无原创 2022-10-12 10:10:05 · 183 阅读 · 1 评论 -
2021-iccv-Face, Body, Voice: Video Person-Clustering with Multiple Modalities
Contributions: 提出一种多模态人物聚类方法,使用face、body、voice 提出Video Person Clustering(VPC)数据集。在原有数据集的基础上(face),增加body、voice标注。视频均来自电影和电视剧 Methods: 三步聚类法 注:数据集、代码可下载 ......原创 2022-05-24 10:59:08 · 150 阅读 · 0 评论 -
Movies2Scenes: Learning Scene Representations Using Movie Similarities
《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》 步骤 从genre/synopsis/more-like-this information中选出类别相同的电影,然后从相似的电影的找出前50%相似的scene作为positive samples 将每k帧的frame划分patch,加上position embedding输入到transformer-based的网络中抽取特征,用公式(原创 2022-05-22 21:26:16 · 217 阅读 · 0 评论 -
2019-iccv-A Graph-Based Framework to Bridge Movies and Synopses
论文阅读:直接看这篇 注1:论文已经公开代码 注2:数据集因为版权原因没有公开,只公开了特征原创 2022-05-21 21:49:56 · 74 阅读 · 0 评论 -
如何将多模态特征载入模型
《Learning a Text-Video Embedding fromIncomplete and Heterogeneous Data》 所有数据存成.npy,然后np.load(.npy): class LSMDC(Dataset): def __init__(self, clip_path, text_features, audio_features, flow_path, face_path, **): self.visual_features = .原创 2021-06-02 16:30:52 · 737 阅读 · 0 评论