Contributions: 提出一种多模态人物聚类方法,使用face、body、voice提出Video Person Clustering(VPC)数据集。在原有数据集的基础上(face),增加body、voice标注。视频均来自电影和电视剧 Methods: 三步聚类法 注:数据集、代码可下载