一、论文信息
论文名称:Robust Speech Recognition via Large-Scale Weak Supervision
代码地址:https://github.com/openai/whisper
官方博客:https://openai.com/blog/whisper
作者团队:OpenAI

二、介绍
Whisper是一个通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。人工智能公司 OpenAI 开源了Whisper 自动语音识别系统,Open AI 强调 Whisper 的语音识别能力已达到人类水准。
Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言,其中11万小时覆盖96 种语言,12万小时的语言标号为英语,用多任务(multitask)监督数据对 Whisper 进行了训练。
订阅专栏 解锁全文
&spm=1001.2101.3001.5002&articleId=127952138&d=1&t=3&u=ad573ec028e348038e286cd65d4653f8)
1626

被折叠的 条评论
为什么被折叠?



