![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 66
楚cheriy
freedom is not free
展开
-
音频的预处理
1分帧语音信号为短时平稳信号,取一小段可以看做是平稳的所以要加窗,并且相邻两帧之间有一部分重叠原因是:语音信号是时变的,在短时范围内特征变化较小,所以作为稳态来处理;但超出这短时范围语音信号就有变化了。在相邻两帧之间基音发生了变化,如正好是两个音节之间, 或正好是声母向韵母过渡,等等,这时,其特征参数有可能变化较大,但为了使特征参数平滑地变化,在两个不重叠的帧之间插一些帧来提取特征参数,这就形成了相邻帧之间有重叠部分,傅里叶变换要求输入的信号是平稳的。总帧数=audio_length//hop_le原创 2021-02-25 23:03:09 · 1670 阅读 · 3 评论 -
pytorch中的一些函数
pytorch中的一些函数:1.储存模型的一些函数model.parameters()与model.state_dict()是Pytorch中用于查看网络参数的方法。一般来说,前者多见于优化器的初始化,例如:后者多见于模型的保存,如:2.torch.nn.util.rnn.pad_sequence()参考:https://www.cnblogs.com/yuqinyuqin/p/14100967.html3.hdf5storage.savemat地址:https://原创 2021-02-22 02:30:19 · 290 阅读 · 0 评论 -
如何数四维矩阵
如何数四维矩阵,如下是一个四位矩阵,形状为(4,3,2,5)tensor([[[[-0.3037, 0.5017, 0.2698, 0.7181, 0.7317], [ 0.2041, -2.1096, 2.0244, -2.0167, -0.4281]], [[ 0.0483, 0.0486, -0.9498, -0.1509, -0.9814], [-0.0850, -0.8587, 1.4044, 0.6037, -...原创 2021-02-21 01:07:17 · 3098 阅读 · 0 评论