【语音之家】AI产业沙龙—语音技术在国音智能的应用

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、国音智能、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—语音技术在国音智能的应用,将于2022年9月27日18:30-20:50线上直播。

参会嘉宾

许敏强

嘉宾简介:许敏强,国音智能首席科学家,博士,硕士生导师,师从“计算机视觉之父”Thomas S.Huang院士。原阿里巴巴语音团队创始人之一、达摩院声纹算法负责人,百度云语音和数字人算法团队负责人。先后在微软亚洲研究院、阿里和百度任职并从事声纹和语音识别、数字人等领域的研究工作。曾7次带领团队在NIST CTS、VoXCeleb等国际语音处理领域比赛中获得第一。中国计算机协会CCF语音对话与听觉专委执行委员。

分享主题:The SpeakIn System Description for VoxSRC2021 & FFSVC2022

摘要:作为声纹识别比赛 VoxSRC2021(The Third VoxCeleb Speaker Recognition Challenge) 和 FFSVC2022(Far-field Speaker Verification Challenge 2022)两场比赛的冠军团队,本报告分享了针对两场比赛的方案设计和系统描述,展示了声纹识别领域的最新技术和成果。

郑渝

嘉宾简介:郑渝,国音智能声纹识别算法工程师,负责声纹识别算法研发、迭代和落地。曾多次作为核心主力参加国际公开说话人识别比赛并获得冠军。支持公司声纹算法的各类场景应用和业务需求,有丰富的落地经验。

分享主题:基于深度学习的声纹识别技术框架简述

摘要:介绍了基于深度学习的声纹识别技术的基础技术框架,并对其原理进行剖析。同时,结合深度学习的前沿进展,探索其在声纹识别算法中的效果优化。

 

郝瀚

嘉宾简介:郝瀚,国音智能语音算法工程师,负责语音识别算法的迭代与落地,开发的语音识别系统应用于公司内部多条产品线,拥有丰富的模型研发与落地经验。

分享主题:语音识别技术在会议系统中的应用

摘要:本主题介绍了国音智能语音识别技术框架,并从会议系统的场景出发介绍整体技术和优化细节,包括远场识别优化,热词速度优化等。

 

沈阳

嘉宾简介:沈阳,国音智能语音算法工程师,负责语音识别算法优化,自监督语音识别以及小语种、方言识别。

分享主题:基于预训练模型的小语种语音识别

摘要:本主题介绍了预训练模型在工业界的落地;低标注资源条件下如何打造语音识别系统;基于预训练模型的小语种语音识别思路、面临的困难以及对未来的展望。

 沙龙议程

时间主题
18:30-19:05The SpeakIn System Description for 
VoxSRC2021 & FFSVC2022
报告人:许敏强
19:05-19:40基于深度学习的声纹识别技术框架简述
报告人:郑渝
19:40-20:15语音识别技术在会议系统中的应用
报告人:郝瀚
20:15-20:50基于预训练模型的小语种语音识别
报告人:沈阳

参加方式

CSDN直播间:【语音之家】AI产业沙龙—语音技术在国音智能的应用-CSDN直播

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值