关闭

[置顶] 【12月限时免费】上海方言手机语音数据库

标签: 限时免费上海语音识别手机数据库
1432人阅读 评论(0) 收藏 举报
分类:
数据介绍 
 
本数据摘自数据堂采集制作的“上海方言手机语音数据库(1000人)”,即发音人在手机环境下录制的上海方言语料,本数据录音人数:126人,总录音数:28553条,平均每人:229条。所有语音数据均经过人工转写,可用于手机语音识别研发等。  
 
具体指标
 
    1)录音环境 
 
安卓手机环境,录音环境安静,不包括明显的其他人说话的声音。 
 
    2)录音设备 
 
覆盖了常用的安卓手机,包括三星、华为、中兴、HTC、联想、酷派、小米等厂商的流行机型。 
 
    3)录音人 
 
126名来自上海方言区不同年龄段的录音人 
 
    4)录音语料
 
录音语料包括4.1万个中文句子,包括:各领域的用户问题、用户短信、客服查询。所有语音都经过人工转写,不合格语音被剔除。 
 
    5)采样格式
 
16000Hz,16位,单声道,wav格式  
 
数据格式 
 
每个录音人对应一个唯一编号,每个录音人的数据放在一个文件夹下,包括: 
 
    1)录音人信息文件(.txt):存放该录音人的性别、年龄、籍贯及所用手机型号 
 
    2)该录音人的各个句子的wav格式语音文件,文件以句子编号命名。例如:G006S1007.wav是编号为G006的录音人录制的语音,对应文本为编号G006S1007的句子。
 
系列语音数据(部分)
 
    1)中文手机语音数据库(2500人)
 
    2)英文手机语音数据库(2500人)
 
    3)粤语手机语音数据库(2500人)
 
    4)四川方言手机语音数据库(1000人)






 
0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:459392次
    • 积分:6789
    • 等级:
    • 排名:第3567名
    • 原创:175篇
    • 转载:350篇
    • 译文:0篇
    • 评论:52条
    文章分类
    最新评论
    友情链接