语音识别-基础(一):简介【语音转文本】

本文介绍了语音识别的基本概念,即自动语音识别(ASR),主要关注将语音转化为可读的文本内容。通常所说的语音识别主要指狭义的语音转文本识别(STT),与语音合成(TTS)相对应。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

一、什么是语音识别

语音识别,通常称为自动语音识别(AutomaticSpeechRecognition,ASR),主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,也有可能是二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称 语音转文本识别(Speech-To-Text,STT)更合适,这样就能与 语音合成(Text-To-Speech,TTS)对应起来。

在这里插入图片描述




参考资料:
语音识别(一):简介

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值