LRW-1000是目前公开的最大的普通话词汇级唇语数据集。
- 1000个中文词汇,每个词汇对应一个音节或一个汉字,涵盖了日常生活、社会、科技、教育等多个领域。
- 718,018个样本实例,来自于2000多个不同的说话者,持续时间约57小时。
- 多样化的语音模式和成像条件,包括不同的音量、语速、口型、表情、姿态、年龄、性别、化妆、光照、分辨率等。
- 详细的数据标注,包括每个样本的视频文件名、音频文件名、说话者ID、词汇类别、词汇内容、视频时长等。
LRW-1000是目前公开的最大的普通话词汇级唇语数据集。