![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音信号处理
林深迷了鹿
这个作者很懒,什么都没留下…
展开
-
awk grep sed 语音识别 应用 ----aishell 处理transcipt为合适的格式 和 利用DaCiDian来分词
对aishell_transcript_v0.8.txt进行处理(去掉文本之间的空格,并且修改wav名称和文本之间的隔断为tap)awk '{for(i=2;i<=NF;++i) printf $i; print "\n"}' aishell_transcript_v0.8.txt > ~/home/aishell/data/text取wav编号,为合成text分词做准备awk '{print $1}' aishell_transcript_v0.8.txt > ~/home/原创 2021-03-22 21:43:50 · 280 阅读 · 0 评论 -
语音和音乐信号中的预加重处理
功率谱和频率的关系语音和音乐信号中,信号的功率谱是随着频率的增加而减小的。也就是说:功率谱大小和频率高低是成反比的,频率越高,功率谱越低,反之亦然。为什么要在语音信号提取特征之前进行预加重首先看一下下图,下图是一段3.5秒的wav片段的频谱图,很显然,高频信号频率比较大,而低频信号频率比较小。大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容许的程度。但是由于消息信号中较高频率分量的能量小,很少有足以产生最大频偏的幅度,因此产生最大频偏的信号幅度多数...原创 2020-07-09 18:21:34 · 1604 阅读 · 1 评论 -
如何理解短时傅里叶变换(Short Time Fourier Transform, STFT)
因为最近一直在学习语音信号的处理,看了Haytham Fayek的一篇博客后关于什么是傅里叶变换感到很迷惑,所以就专门写下一篇文章,整理一下我从网页上搜集的内容。短时傅里叶变换(Short Time Fourier Transform, STFT) 是一个用于语音信号处理的通用工具.它定义了一个非常有用的时间和频率分布类, 其指定了任意信号随时间和频率变化的复数幅度. 实际上,计算短时傅里叶变换的过程是把一个较长的时间信号分成相同长度的更短的段, 在每个更短的段上计算傅里叶变换, 即傅里叶频谱。实现原创 2020-06-28 18:08:56 · 8323 阅读 · 0 评论 -
语音信号处理之语音特征提取(1)机器学习的语音处理
语音信号处理语音特征提取机器学习的语音处理原创 2020-06-23 15:58:20 · 4349 阅读 · 1 评论