文章目录 语音转写调研 1. 科大讯飞 2. 百度 AI 语音技术 3. 阿里智能语音交互 4. 华为云智能语音交互 写在最后 语音转写调研 本文主要介绍以下几种语音转写的介绍,分享给大家。 1. 科大讯飞 语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。 语音转写是非常适合当前交互单中语音音频的转写 API。 它能够将预先录制完毕的完整音频文件,通过转写服务输出此音频对应的完整文字结果。 特点 支持多种方言 支持区分讲话人 官网文档点击进入 开发者文档 2. 百度 AI 语音技术 音频文件转写 接口可以将大批量的音频文件异步转写为文字。 适合批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。