声音处理流程

目录

概念

  • 回声消除 AEC(Acoustic Echo Cancellation)
  • 自动增益 AGC(Auto Gain Control)
  • 静音检测 VAD(Voice Activity Detection)
  • 噪声抑制 NS(Noise Suppression)
  • 自动语音识别 ASR(Automatic Speech Recognition)接收音频输入,输出一个转录的句子文本。一般包括4大块:信号处理、声学模型、解码器、后处理。首先采集声音,进行信号处理,将语音信号转化到频域,从N毫秒的语音提出特征向量,提供给声学模型,声学模型负责将音频分类成不同的音素,接着解码器得出频率最高的一串词串,最后的后处理就是将单词组成容易读取的文件。
  • 自然语言理解NLU(Nature Language Understanding)负责将自然语言表示成计算机能够处理的结构化数据。接收文本输入,输出结构化的三元组Domain(领域)+ Intent(意图)+ Solt(插槽)。主要通过分词、词性标注、命名实体识别、句法分析、指代消解等进行语义解析。

参考:
https://xie.infoq.cn/article/e633a9d506f87438df71c9abe

  • 6
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值