语音处理
文章平均质量分 68
呦呵嘿呀
Come as you are.
展开
-
python包 musdb安装后不能使用的问题,报错“RuntimeError: ffmpeg or ffprobe could not be found! Please install ...“
问题描述如下:因为做实验要用到MUSDB18这个数据集,但是数据集里所包含的数据均为mp4格式文件,因此在进行数据处理时需要用到musdb这个包去进行音频的处理,musdb包所依赖的两个关键包有两个:ffmpeg和ffprobe。在环境中安装完以上三个包以后,进入代码进行调试,报错如下:问题分析:提示错误信息为musdb依赖的两个包ffmpeg和ffprobe找不到,表面意思看是没有安装这两个包,参考错误信息中的解决办法是分别安装ffmpeg和stempeg两个包(stempeg我已经安装了0.1.原创 2021-03-16 19:29:44 · 3190 阅读 · 1 评论 -
Python实现为语音文件创建声谱图(包括窄带声谱和宽带声谱)
选题自(数字语音处理理论及应用)Python实现画语音文件的声谱图代码部分结果以及分析参数选用:窗函数:汉明窗宽带声谱窗长:5ms宽带声谱FFT长度:1024窄带声谱窗长:50ms窄带声谱FFT长度:1024使用对数幅度声谱图为彩色代码部分import matplotlib.pyplot as plt #画图用import librosa.core as lc #计...原创 2020-04-16 10:56:47 · 4623 阅读 · 14 评论 -
torch.stft()与librosa.stft()的对比
对比torch.stft与librosa.stft在获取语音的幅度和相位的不同表达torch.stftlibrosa.stfttorch.stftstft(self, n_fft, hop_length=None, win_length=None,window=None,center=True, pad_mode='reflect', normalized=False, onesided=Tr...原创 2020-04-13 17:47:16 · 11265 阅读 · 0 评论 -
数字语音处理 短时过零率 短时能量 短时幅度 Python代码实现 可视化
选题自(数字语音处理理论及应用)·窗函数选用 hamming 窗原因:由于语音信号的非平稳特性,使用加窗可以对语音信号分帧当成平稳信号来分析和处理。①由于直接对信号(加矩形窗)会产生频谱泄露,为了改善频谱泄露的情况,选用 hamming 窗或者 hanning 窗,它们都是升余弦窗,幅频特性是旁瓣衰减较大,使得主瓣加宽并降低,旁瓣显著减小,减小泄漏;但对比 hanning 窗,hamm...原创 2020-04-05 13:53:34 · 3461 阅读 · 0 评论