声音处理流程

最新推荐文章于 2024-07-19 11:59:06 发布

mushanshui

最新推荐文章于 2024-07-19 11:59:06 发布

阅读量293

点赞数 6

文章标签：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mushanshui/article/details/138939682

版权

目录

概念

概念

回声消除 AEC（Acoustic Echo Cancellation）
自动增益 AGC（Auto Gain Control）
静音检测 VAD（Voice Activity Detection）
噪声抑制 NS（Noise Suppression）
自动语音识别 ASR（Automatic Speech Recognition）接收音频输入，输出一个转录的句子文本。一般包括4大块：信号处理、声学模型、解码器、后处理。首先采集声音，进行信号处理，将语音信号转化到频域，从N毫秒的语音提出特征向量，提供给声学模型，声学模型负责将音频分类成不同的音素，接着解码器得出频率最高的一串词串，最后的后处理就是将单词组成容易读取的文件。
自然语言理解NLU（Nature Language Understanding）负责将自然语言表示成计算机能够处理的结构化数据。接收文本输入，输出结构化的三元组Domain（领域）+ Intent（意图）+ Solt（插槽）。主要通过分词、词性标注、命名实体识别、句法分析、指代消解等进行语义解析。

参考：
https://xie.infoq.cn/article/e633a9d506f87438df71c9abe

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
声音处理流程

【代码】声音处理流程。
复制链接

扫一扫

mushanshui CSDN认证博客专家 CSDN认证企业博客

码龄12年

41: 原创

6万+: 周排名

4万+: 总排名

8万+: 访问

: 等级

528: 积分

33: 粉丝

72: 获赞

6: 评论

149: 收藏

私信

关注

热门文章

分类专栏

最新评论

SpringBoot 404问题汇总
不让我抬杠，那我拿什么理智？: 我遇到的情况是，将pom.xml里的依赖spring-boot-starter-web替换spring--web，就可以了
gn静态库编译问题
饭盒----001: 写的好，帮大忙了
SpringBoot 404问题汇总
mushanshui: SpringBootServletInitailizer子类就是项目中继承此类的类，将项目打包成war包放置到tomcat的webapps目录下后，tomcat会寻找此类来启动war包。在本地可以访问，测试环境出现404很可能是nignx转发配置错误
SpringBoot 404问题汇总
A文东啊: SpringBootServletInitailizer子类。怎么看？我有个下载接口在测试环境404 control其他接口都正常还有就是本地下载是正常的
Mysql允许远程访问
燃烧的雪碧: mysql --help | grep -A 1 "Default options are read from the following" ，下面第一个就是

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。