对音频信号作短时傅里叶变换(STFT)/小波变换处理(python + matlab)

对音频信号作短时傅里叶变换(STFT)处理,并绘制语谱图

摘要:录制一段音频,分别在matlab,python两种环境下,对其作短时傅里叶变换(STFT),最终得到期望的语谱图。

一、前言

1. 基础概念:
在对音频信号进行分析处理前,先简要回顾一下所用到的分析函数傅里叶变换的相关知识。

  • 什么是傅里叶变换?
    傅里叶的基本定义与性质在这里就不作赘述了,文章主要想说明它的主要应用,以助于大家对这个概念有一个更为形象的认识。(傅里叶基础概念与性质,推荐观看b站李永乐的讲解,文末附视频链接)
    傅里叶变换处理平稳信号

  • 傅里叶变换是一种分析信号的方法,它可分析信号的成分,也可用这些成分合成信号。在分析信号时,主要应用于处理平稳信号,通过傅里叶变换可以获取一段信号总体上包含哪些频率的成分,但是对各成分出现的时刻无法得知。

  • 因此对于非平稳信号,傅里叶变换就显示出了它的局限性,而我们日常生活中的绝大多数音频都是非平稳信号的。而解决这一问题的方法,就是采用短时傅里叶变换或者小波变换,对信号进行处理。

  • 什么是短时傅里叶变换?
    短时傅里叶加窗示意
    短时傅里叶变换(STFT)的核心思想:“加窗”,即把整个时域过程分解成无数个等长的小过程,每个小过程近似平稳,再对每个小过程进行傅里叶变换(FFT)。尽管STFT可以处理非平稳信号,但是它仍然有其局限性,即对窗函数的宽窄无法做到精确定义。
    窗函数选择宽窄的影响
    窗函数选择太窄,窗内的信号太短,会导致频率的分析不够精准,频率分辨率差;窗选的太宽,时域上又不够精细,时间分辨率低

  • 傅里叶与短时傅里叶的联系与区别?
    傅里叶与短时傅里叶联系与区别

  • 什么是小波变换?

    小波变换的核心思想:“把傅里叶变换的无限长三角函数的基换成有限长的会衰减的小波基”,这样不仅可以获取频率,还可以定位时间。更为详细的介绍可以参考本段末附上的参考来源,查询大佬相关阐述。

本文参考来源:
https://rf.eefocus.com/article/id-xiaobobianhuan?p=1 傅里叶–短时傅里叶–小波分析
https://blog.csdn.net/daaikuaichuan/article/details/80781505 小波与短时傅里叶的区别
https://wenku.baidu.com/view/4b9bb22c30b765ce0508763231126edb6f1a768e.html?fr=search-1_income7 短时傅里叶的概念理解

  • 什么是语谱图?

    语谱图:时间依赖于傅里叶分析的显示图形,实际上是一种动态频谱,综合了频谱图和时域波形图的优点,明显地显示出语音频谱随时间的变化情况。(其中,纵轴为频率,横着为时间,任一给定频率成分在给定时刻的强弱,用点的黑白度来表示)

2. 概念的形象化理解:

  • 短时傅里叶变换进行音频分析流程的直观理解
    STFT的直观理解
  • 欧拉公式可以将任意函数转化为一系列正(余)弦函数之和。任意函数在这里指我们的时域信号,而正(余)弦函数包含信号的频率和对应振幅信息。(时域处理)
  • 傅立叶变换可以将时间0~t内采集的信号(时域,横轴时间、纵轴大小)分解为不同频率上的信号分量(频域,横轴频
  • 71
    点赞
  • 446
    收藏
    觉得还不错? 一键收藏
  • 21
    评论
基于Matlab的语音变声系统是一种利用Matlab编程语言开发的声音处理系统。它通过改变声音信号的频谱和时域特性,使得原始语音信号产生变化,从而实现变声效果。 该系统的工原理是先对原始语音信号进行预处理,如去噪、降噪等处理,以提高语音的质量。然后,利用Matlab中的信号处理工具箱实现变声算法。 变声算法主要包括频域变换和时域重采样两个步骤。频域变换可以通过傅里叶变换等方法将声音信号转换到频域中,然后可以通过改变频谱的幅度和相位信息来改变声音的频谱特性。时域重采样则可以改变语音信号的速率,从而改变声音的音调和语速。 通过调整变声算法的参数,可以实现不同的变声效果。例如,可以实现男变女、女变男、婴儿声等不同的变声效果,也可以实现混响、合唱效果等多种声音效果。此外,还可以根据需要实现实时变声或离线处理。 基于Matlab的语音变声系统有很多应用。例如,可以用于舞台剧或电影中的声音处理,使角色的声音更加逼真。另外,还可以用于音乐制中,改变歌手的声音特性,创造出不同的音乐风格。 综上所述,基于Matlab的语音变声系统通过频域变换和时域重采样方式实现声音的变声效果。这个系统具有广泛的应用前景,可以用于改变声音特性、创造不同的声音效果。
评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值