python绘制语谱图(不掉包实现)

1.绘制语谱图

为方便使用,现将同学唐维康的代码做出如下修正,封装成类,可以灵活调用

@作者:kingback

@文件名称:MySpec.py

@IDE:PyCharm

@文件创建时间:2021-04-24 22:0008

@月份:4import librosa
import numpy as np
import matplotlib.pyplot as plt

class MySpec(object):
    def __init__(self,filename,wlen,inc):
        #参数预定义
        self.filename=filename
        self.wlen=wlen
        self.inc=inc
        self.nfft=self.wlen
        self.win=self.hanning_window(self.wlen)

    # 计算每帧对应的时间
    def FrameTimeC(self,frameNum, frameLen, inc, fs):
        ll = np.array([i for i in range(frameNum)])
        return ((ll - 1) * inc + frameLen / 2) / fs

    # 分帧函数
    def enframe(self,x, win, inc=None):
        nx = len(x)
        if isinstance(win, list) or isinstance(win, np.ndarray):
            nwin = len(win)
            nlen = nwin  # 帧长=窗长
        elif isinstance(win, int):
            nwin = 1
            nlen = win  # 设置为帧长
        if inc is None:
            inc = nlen
        nf = (nx - nlen + inc) // inc
        frameout = np.zeros((nf, nlen))
        indf = np.multiply(inc, np.array([i for i in range(nf)]))
        for i in range(nf):
            frameout[i, :] = x[indf[i]:indf[i] + nlen]
        if isinstance(win, list) or isinstance(win, np.ndarray):
            frameout = np.multiply(frameout, np.array(win))
        return frameout

    # 加窗
    def hanning_window(self,N):
        nn = [i for i in range(N)]
        return 0.5 * (1 - np.cos(np.multiply(nn, 2 * np.pi) / (N - 1)))

    # 短时傅里叶变换
    def STFFT(self,x, win, nfft, inc):
        xn = self.enframe(x, win, inc)
        xn = xn.T
        y = np.fft.fft(xn, nfft, axis=0)
        return y[:nfft // 2, :]

    #自己画语谱图的主函数
    def demain(self):

        data,fs=librosa.load(self.filename,sr=None,mono=False)      # sr=None声音保持原采样频率, mono=False声音保持原通道数
        y = self.STFFT(data, self.win, self.nfft, self.inc)

        FrequencyScale = [i * fs / self.wlen for i in range(self.wlen // 2)]  # 频率刻度
        frameTime = self.FrameTimeC(y.shape[1], self.wlen, self.inc, fs)  # 每帧对应的时间
        LogarithmicSpectrogramData = 10 * np.log10((np.abs(y) * np.abs(y)))  # 取对数后的数据

        plt.pcolormesh(frameTime, FrequencyScale, LogarithmicSpectrogramData)
        plt.colorbar()
        # plt.savefig('语谱图22.png')
        plt.show()


2.调用方式

from MySpec import MySpec

......其他代码省略

filename="I:/王延凯新建LibriVox数据集(3s)/english/english.2br02b_1_vonnegut_64kb_0.wav"
wlen=512
inc=256

mySpec=MySpec(filename,wlen,inc)
mySpec.demain()
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王延凯的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值