数据
岳额不到五
这个作者很懒,什么都没留下…
展开
-
Condensed Movies: Story Based Retrieval with Contextual Embeddings
无原创 2022-10-12 10:10:05 · 184 阅读 · 1 评论 -
2021-iccv-Face, Body, Voice: Video Person-Clustering with Multiple Modalities
Contributions:提出一种多模态人物聚类方法,使用face、body、voice提出Video Person Clustering(VPC)数据集。在原有数据集的基础上(face),增加body、voice标注。视频均来自电影和电视剧Methods:三步聚类法注:数据集、代码可下载......原创 2022-05-24 10:59:08 · 151 阅读 · 0 评论 -
Movies2Scenes: Learning Scene Representations Using Movie Similarities
《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》步骤从genre/synopsis/more-like-this information中选出类别相同的电影,然后从相似的电影的找出前50%相似的scene作为positive samples将每k帧的frame划分patch,加上position embedding输入到transformer-based的网络中抽取特征,用公式(原创 2022-05-22 21:26:16 · 219 阅读 · 0 评论 -
2019-iccv-A Graph-Based Framework to Bridge Movies and Synopses
论文阅读:直接看这篇注1:论文已经公开代码注2:数据集因为版权原因没有公开,只公开了特征原创 2022-05-21 21:49:56 · 75 阅读 · 0 评论 -
如何将多模态特征载入模型
《Learning a Text-Video Embedding fromIncomplete and Heterogeneous Data》所有数据存成.npy,然后np.load(.npy): class LSMDC(Dataset): def __init__(self, clip_path, text_features, audio_features, flow_path, face_path, **): self.visual_features = .原创 2021-06-02 16:30:52 · 739 阅读 · 0 评论