全球权威声纹识别竞赛斩获双料冠军 网易AI Lab智能技术领先国际

允中 发自 凹非寺
量子位 报道 | 公众号 QbitAI

中国力量,又双叒夺冠了。

这一次,是在全球规模最大、最全面的语音顶会INTERSPEECH 2020上。

挑战比拼内容,则是当前语音研究领域最火热的议题之一——“声纹识别”。

最新公布成绩的SdSV声纹识别比赛中,网易AI Lab从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。

SdSV声纹识别比赛是业界权威性赛事,参赛队伍来自全球多所知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。

能在与众多好手的较量中脱颖而出,网易AI着实秀了一把技术“肌肉”。

网易AI如何夺冠?

SdSV Challege 2020的主要目的,是评估在短时场景下针对文本相关(TD)和文本无关(TI)说话者验证(SV)的新技术。

今年,全球共有67支队伍注册参与挑战。

比赛中,网易 AI Lab基于常见的X-Vector和PLDA算法,创新地提出了一种ASR-free的文本相关声纹识别算法。

相比传统的Deep Speaker Embedding方法,该算法不需要依赖语音识别,就能够在多语言环境下,同时完成说话人和文本内容的验证。

比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标。

网易AI Lab的单模型在两个指标均为最佳,其中EER达到了1.67%,相比第二名降低了11.6%,并远低于比赛 X-Vector基线系统(EER=9.05%)。

网易AI Lab

这样的好成绩,对于网易AI Lab来说,并不是福至心灵的运气,而是确有长期的技术积累。

声纹识别是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。

目前,人工智能主要有三个研究方向:视觉识别、智能语音、NLP自然语言处理。

其中,在语音研究领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的身份认证问题,多应用在安全验证场景。

从近几年的市场趋势来看,银行,金融服务,保险已成为声纹识别应用的领导领域。

可以说,随着技术的不断成熟和融合,声纹识别技术正在逐渐融入日常生活,像指纹识别、面部识别一样成为人人触手可及的AI技术。应用潜力巨大。

而成立于2017年的网易 AI Lab,早已将声纹识别技术运用到了游戏场景中。

除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。

目前,网易AI Lab在杭州、广州、上海均设有分部,主要运用AI黑科技为旗下各大游戏工作室助力,并赋能给更多产品。

总的来说,网易AI Lab的研究方向包括三大方面:

  • 计算机视觉和图形学研究

  • 语音语言处理研究

  • 游戏AI研究

当前,已有不少研发技术处于行业领先地位,并接入了多款游戏。

在前不久刚刚落幕的2020世界人工智能大会上,网易CEO丁磊曾表示,人工智能选对了应用场景,发挥的效率就会非常高。

而新鲜摘下的冠军果实,也彰显了网易AI的技术能力。

网易AI,未来可期。

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

报名 | 智慧生活行业私享会

欢迎报名,与峰瑞资本、石头科技、网易有道、思必驰、九号机器人、视感科技、云丁科技等企业高管,共同探讨如何借力资本市场、把握行业趋势,打造全场景智慧生活:

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值