在网易有道做语音算法工程师是一种怎样的体验?-1

网易有道的语音算法工程师时来和Harry Wu在INTERSPEECH 2020口音英语语音识别挑战赛中获得佳绩。他们利用现有技术和新方案,证明了有道AI语音技术的实用性。团队以技术落地为导向,注重用户体验,已将语音识别和合成技术应用于多款产品。通过比赛,团队不仅验证了技术方案,还学习了新思路,展现出务实、年轻的团队风貌。
摘要由CSDN通过智能技术生成

 

一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛能拿下怎样的成绩?

时限是,10天。

近日,全球语音顶会INTERSPEECH 2020「口音英语语音识别挑战赛」结果公布,一支名叫「大耳朵图图喵喵喵」的团队摘下了两大赛道的第二名和第三名。

参赛选手是这位:

 

啊不,其实来自他们当中。

 

说起网易有道与AI语音技术相关的产品,大家或许都不陌生,比如丁磊多次安利、上市都带着的有道词典笔……

相比在市场上取得的认可,许多人可能不会想到,有道AI语音背后的团队非常年轻:成立不到两年,大部分都是应届生,来自知名语音实验室,或者海外高校深造项目。

「参赛其实是验证技术方案」

此次拿奖的时来和Harry Wu(均为花名),就是今年7月刚刚加入网易有道的应届生。

 

事实上,打这场比赛,对于他们而言更像是一次对工作成果的「突击测验」:被通知要参赛时,距离提交测试结果的截至日期只剩下10天了。

时间紧迫,两人临时组队,又是代表团队第一次出征算法赛事,但在心态上他们倒还真一点也不慌。

用有道之前积累的技术去参赛,10天也足够了。

攻坚克难了这么久,是时候拿出来检验一下了。

INTERSPEECH 2020「口音英语语音识别挑战赛」由中国计算机学会、西北工业大学、上海交通大学、新加坡南洋理工大学等多家重量级机构联合举办,共分为两个赛道:

Track1是口音种类识别,参赛者需要使用官方提供的各种口音英语训练数据,训练语种分类模型

Track2则是口音英语语音识别,参赛者需要使用规则限定的训练数据,训练语音识别模型

 

简单来说,一方面是要做英语口音的分类,另一方面是要做语音识别,把带口音的英语语音转成文字。

时来和Harry的工位就挨在一起,两人当即一合计,觉得在语音识别方面,基本可以原封不动地用上现成的技术——有道词典、精品课、云笔记等一系列产品里都有ASR技术的身影,平时的研发工作中,早已经考虑到了复杂口音的情况,识别准确率和响应速度都是经过实战检验的。<

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值