Whisper-CPP:CPU-AI语音识别的天才,CosyVoice - 阿里最新开源语音克隆、文本转语音项目 一键整合包下载,GPT-4o实时语音方案Livekit开源voice agent音视频。
使用Streamlit和wheaster.CPP,在您的计算机上运行。
什么是Whisper?
Whisper是一个自动语音识别(ASR)系统,使用从网络收集的68万小时的多语言和多任务监督数据进行培训。
OpenAI开源了模型和推理代码,作为构建有用应用程序和进一步研究强大语音处理的基础。这对我们来说是个好消息!
我们表明,使用如此庞大而多样化的数据集可以提高口音、背景噪音和技术语言的鲁棒性。此外,它允许多种语言的转录,以及从这些语言翻译成英语。
Whisper