自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 python包 musdb安装后不能使用的问题,报错“RuntimeError: ffmpeg or ffprobe could not be found! Please install ...“

问题描述如下:因为做实验要用到MUSDB18这个数据集,但是数据集里所包含的数据均为mp4格式文件,因此在进行数据处理时需要用到musdb这个包去进行音频的处理,musdb包所依赖的两个关键包有两个:ffmpeg和ffprobe。在环境中安装完以上三个包以后,进入代码进行调试,报错如下:问题分析:提示错误信息为musdb依赖的两个包ffmpeg和ffprobe找不到,表面意思看是没有安装这两个包,参考错误信息中的解决办法是分别安装ffmpeg和stempeg两个包(stempeg我已经安装了0.1.

2021-03-16 19:29:44 2985 1

原创 pytorch代码 在top指令下CPU%占用过高的解决办法

pytorch代码 在top指令下CPU%占用过高的解决办法问题如下:深度学习使用的torch框架,并且代码中设置gpu使用正常,但是在top指令下发现了这样的问题:问题分析:正确设置了使用GPU加载数据到模型中,但是仍然出现很大的CPU占用率,高达2000%,也即占满了20个CPU核心(服务器一共40个)。这种情况在我处理音频采样率为8192时并不明显,当我把采样率换成原始采样率(44100Hz)时,出现了这种情况(有可能与数据有关)。造成这种情况的原因很可能是我的数据采样点的突然增大,触发了多线

2021-03-16 19:10:33 3330 2

原创 获取列表中索引时报错:‘ValueError: shape mismatch: objects cannot be broadcast to a single shape‘

最近在改代码的时候遇到一个坑,报错如题目所示“ValueError: shape mismatch: objects cannot be broadcast to a single shape”。报错的代码段比较长,在原代码段中报错的部分是因为我把两种数据类型的数据(numpy形式的数组和列表list)存到了一个新的列表中,我在后面需要用到两个数据在列表里的index索引值,当我直接去获取时出现错误,这里只针对报错的问题写了一个简单的代码段:import numpy as npa = [0, 1,

2020-07-03 22:43:54 8207

原创 2020.6.19

假期来了,撸起袖子加油干。

2020-06-19 23:40:50 277

原创 Pytorch报错:'UserWarning: RNN module weights are not part of single contiguous chunk of memory....'

最近在跑代码的时候遇到了一个问题,代码里的网络有使用到RNN,错误信息如下:‘UserWarning: RNN module weights are not part of single contiguous chunk of memory. This means they need to be compacted at every call, possibly greately increasing memory usage. To compact weights again call flatten_

2020-05-11 23:14:01 9272 9

原创 PyTorch中的nn.ModuleList和nn.Sequential

nn.Sequentialnn.Sequential里面的所构造的模块是要按照顺序进行排列的,必须确保前一个模块的输出大小和下一个模块的输入大小是一致的。import torchimport torch.nn as nnimport torch.nn.functional as Fclass net_seq(nn.Module): def __init__(self): ...

2020-04-25 22:31:49 1115

原创 Python for循环中enumerate()与zip()的用法

enumerate()在for循环里enumerate()函数是一个枚举函数,用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标。A = ['python','java','c++','abc']for i,val in enumerate(A): print(i,val)结果:0 python1 java2 c++3 abcz...

2020-04-24 11:28:55 2280

原创 Pytorch 网络中dilation=0和dilation=N (N=1,2,3,...)的区别

假设输入为4x4,卷积核为3x3,stride=1,此时dilation=0的卷积情况:下面是输入为7x7,卷积核为3x3,stride=1,dilation=1时候的卷积情况在这种情况下,卷积核的感受野由原来的3x3变成了现在的5x5,同时没有增加计算量,保留了更多的细节信息。所以假设在dilation=0的情况下卷积核大小为X,使用了dilation=N卷积时卷积核的感受野大小就变成...

2020-04-18 17:24:35 6320 4

原创 Python实现为语音文件创建声谱图(包括窄带声谱和宽带声谱)

选题自(数字语音处理理论及应用)Python实现画语音文件的声谱图代码部分结果以及分析参数选用:窗函数:汉明窗宽带声谱窗长:5ms宽带声谱FFT长度:1024窄带声谱窗长:50ms窄带声谱FFT长度:1024使用对数幅度声谱图为彩色代码部分import matplotlib.pyplot as plt #画图用import librosa.core as lc #计...

2020-04-16 10:56:47 4504 14

原创 torch.stft()与librosa.stft()的对比

对比torch.stft与librosa.stft在获取语音的幅度和相位的不同表达torch.stftlibrosa.stfttorch.stftstft(self, n_fft, hop_length=None, win_length=None,window=None,center=True, pad_mode='reflect', normalized=False, onesided=Tr...

2020-04-13 17:47:16 10908

原创 Pytorch实现 分别使用AlexNet、VGG、NiN对LeNet网络改进

Pytorch实现 分别使用AlexNet、VGG、NiN对LeNet网络改进1.基于AlexNet结构改进LeNet2.基于VGG结构改进LeNet3.基于NiN结构改进LeNet1.基于AlexNet结构改进LeNetAlexNet结构:①与相对较⼩的LeNet相⽐, AlexNet包含8层变换,其中有5层卷积和2层全连接隐藏层,以及1个全连接输出层。②AlexNet将sigmoi...

2020-04-11 00:56:53 1564

原创 LeNet神经网络 Pytorch实现 计算模型参数量 模型保存和加载

LeNet网络模型结构:代码实现:import osimport torchimport torch.nn as nnimport sysimport timeimport d2lzh_pytorch as d2los.environ["CUDA_VISIBLE_DEVICES"] = "0"device = torch.device('cuda' if torch.cuda...

2020-04-07 13:01:05 982

原创 数字语音处理 短时过零率 短时能量 短时幅度 Python代码实现 可视化

选题自(数字语音处理理论及应用)·窗函数选用 hamming 窗原因:由于语音信号的非平稳特性,使用加窗可以对语音信号分帧当成平稳信号来分析和处理。①由于直接对信号(加矩形窗)会产生频谱泄露,为了改善频谱泄露的情况,选用 hamming 窗或者 hanning 窗,它们都是升余弦窗,幅频特性是旁瓣衰减较大,使得主瓣加宽并降低,旁瓣显著减小,减小泄漏;但对比 hanning 窗,hamm...

2020-04-05 13:53:34 3355

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除