数据_岳额不到五的博客-CSDN博客

数据

关注

关注数：文章数：5 文章阅读量：1368 文章收藏量：10

作者: 岳额不到五

这个作者很懒，什么都没留下…

展开

Condensed Movies: Story Based Retrieval with Contextual Embeddings

无

原创 2022-10-12 10:10:05 · 184 阅读 · 1 评论
2021-iccv-Face, Body, Voice: Video Person-Clustering with Multiple Modalities

Contributions:提出一种多模态人物聚类方法，使用face、body、voice提出Video Person Clustering(VPC)数据集。在原有数据集的基础上（face），增加body、voice标注。视频均来自电影和电视剧Methods：三步聚类法注：数据集、代码可下载......

原创 2022-05-24 10:59:08 · 151 阅读 · 0 评论
Movies2Scenes: Learning Scene Representations Using Movie Similarities

《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》步骤从genre/synopsis/more-like-this information中选出类别相同的电影，然后从相似的电影的找出前50%相似的scene作为positive samples将每k帧的frame划分patch，加上position embedding输入到transformer-based的网络中抽取特征，用公式（

原创 2022-05-22 21:26:16 · 219 阅读 · 0 评论
2019-iccv-A Graph-Based Framework to Bridge Movies and Synopses

论文阅读：直接看这篇注1：论文已经公开代码注2：数据集因为版权原因没有公开，只公开了特征

原创 2022-05-21 21:49:56 · 75 阅读 · 0 评论
如何将多模态特征载入模型

《Learning a Text-Video Embedding fromIncomplete and Heterogeneous Data》所有数据存成.npy，然后np.load(.npy)： class LSMDC(Dataset): def __init__(self, clip_path, text_features, audio_features, flow_path, face_path, **): self.visual_features = .

原创 2021-06-02 16:30:52 · 739 阅读 · 0 评论

数据

作者: 岳额不到五

Condensed Movies: Story Based Retrieval with Contextual Embeddings

2021-iccv-Face, Body, Voice: Video Person-Clustering with Multiple Modalities

Movies2Scenes: Learning Scene Representations Using Movie Similarities

2019-iccv-A Graph-Based Framework to Bridge Movies and Synopses

如何将多模态特征载入模型