语音技术――性别辨识和语者验证
2010/11/24
性别辨识和语者验证简介
性别辨识(Gender Recognition)技术是以语音讯号处理的方法,撷取说话者的声音特征,藉此判断说话者的性别是男性或女性,如下流程图所示的技术。
而语者验证(Speaker Verification)技术,如下图所示,我们亦可称之为语者认证(Speaker Authentication)或是语者侦测(Speaker
Detection),主要是用来鉴定一已知身份的说话者其宣称之身份的真实性,利用撷取说话者的声纹特征,我们可以从事先储存的语者声纹资料库中,取出该宣称身份的语者声纹模型,并且和说话者输入的声音做比对,由于系统会先获知该使用者表明的身份(如小美),所以这会造成两种可能的判断错误,其中一种是错误接受(False
Accept),即说话者为一冒充者(Imposter)但被系统误认为其所宣称的身份,另外一种是错误拒绝(False Reject),即系统将真实身份的说话者误判为冒充者。
性别辨识和语者验证特色
本项性别辨识技术的主要特点在于用户不须事先建立个人声纹资料库,祗要提供输入的声纹即可进行辨识,且辨识率在实际的电话语音中可达93%。
语者验证辨识技术的特色分为两种,一种是和本文相关(Text-Dependent)的验证,即用户在建立个人声纹资料库和验证个人声纹所输入声音必须是相同的,另一种是和本文无关(Text-Independent)的验证,即用户在建立个人声纹资料库和验证个人声纹时所输入的声音允许是不同的,而本公司提供的技术同时可应用于上述的两种使用情境,让使用者的应用更广泛。
性别辨识和语者验证应用
性别辨识可应用于需验证男女生性别的场合,例如从身份证号码的第一个数字得知被验证者的性别,验证说话者的性别是否与该身份证号码所载的性别一致,此外也可应用在语音辨识的前端,当辨识出说话者的性别后,以性别相关的语音模型(Gender-Dependent
Model)进行辨认以提升语音辨识率。
语者验证技术的应用则更广泛,在个人方面可应用于个人设备的管控,例如:个人电脑的使用权限设定,在企业方面则有银行信用卡刷卡时的身份核对,或从大量的客服人员对话资料中撷取出是否有含某特定身份者在说话,以减轻客服人员的工作量,并提升客服品质(Quality
Management)。
CTI论坛编辑
相关阅读: