【语音之家】AI产业沙龙—语音技术在国音智能的应用-CSDN博客

本文链接：https://blog.csdn.net/weixin_48827824/article/details/126987384

由CCF语音对话与听觉专委会、中国人工智能产业发展联盟（AIIA）评估组、国音智能、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—语音技术在国音智能的应用，将于2022年9月27日18:30-20:50线上直播。

参会嘉宾

许敏强

嘉宾简介：许敏强，国音智能首席科学家，博士，硕士生导师，师从“计算机视觉之父”Thomas S.Huang院士。原阿里巴巴语音团队创始人之一、达摩院声纹算法负责人，百度云语音和数字人算法团队负责人。先后在微软亚洲研究院、阿里和百度任职并从事声纹和语音识别、数字人等领域的研究工作。曾7次带领团队在NIST CTS、VoXCeleb等国际语音处理领域比赛中获得第一。中国计算机协会CCF语音对话与听觉专委执行委员。

分享主题：The SpeakIn System Description for VoxSRC2021 & FFSVC2022

摘要：作为声纹识别比赛 VoxSRC2021（The Third VoxCeleb Speaker Recognition Challenge）和 FFSVC2022（Far-field Speaker Verification Challenge 2022）两场比赛的冠军团队，本报告分享了针对两场比赛的方案设计和系统描述，展示了声纹识别领域的最新技术和成果。

郑渝

嘉宾简介：郑渝，国音智能声纹识别算法工程师，负责声纹识别算法研发、迭代和落地。曾多次作为核心主力参加国际公开说话人识别比赛并获得冠军。支持公司声纹算法的各类场景应用和业务需求，有丰富的落地经验。

分享主题：基于深度学习的声纹识别技术框架简述

摘要：介绍了基于深度学习的声纹识别技术的基础技术框架，并对其原理进行剖析。同时，结合深度学习的前沿进展，探索其在声纹识别算法中的效果优化。

郝瀚

嘉宾简介：郝瀚，国音智能语音算法工程师，负责语音识别算法的迭代与落地，开发的语音识别系统应用于公司内部多条产品线，拥有丰富的模型研发与落地经验。

分享主题：语音识别技术在会议系统中的应用

摘要：本主题介绍了国音智能语音识别技术框架，并从会议系统的场景出发介绍整体技术和优化细节，包括远场识别优化，热词速度优化等。

沈阳

嘉宾简介：沈阳，国音智能语音算法工程师，负责语音识别算法优化，自监督语音识别以及小语种、方言识别。

分享主题：基于预训练模型的小语种语音识别

摘要：本主题介绍了预训练模型在工业界的落地；低标注资源条件下如何打造语音识别系统；基于预训练模型的小语种语音识别思路、面临的困难以及对未来的展望。

沙龙议程

时间	主题
18:30-19:05	The SpeakIn System Description for VoxSRC2021 & FFSVC2022 报告人：许敏强
19:05-19:40	基于深度学习的声纹识别技术框架简述报告人：郑渝
19:40-20:15	语音识别技术在会议系统中的应用报告人：郝瀚
20:15-20:50	基于预训练模型的小语种语音识别报告人：沈阳