AI
子_衣
这个作者很懒,什么都没留下…
展开
-
要想学习声音分类,我们需要掌握哪些知识汇总
通过掌握以上知识,你将能够开始学习和实践声音分类任务,并逐渐提高你的技能和理解。原创 2023-07-12 09:45:08 · 78 阅读 · 1 评论 -
梅尔频率倒谱系数
MFCCs在语音信号处理和语音识别中广泛应用,它们能够提取语音的重要特征,并对噪声和语音变化具有一定的鲁棒性。梅尔滤波器组设计:设计一组梅尔滤波器,这些滤波器在梅尔频率轴上均匀分布,用于模拟人耳对不同频率的感知差异。离散余弦变换(DCT):对每一帧的对数梅尔频谱应用DCT,得到梅尔频率倒谱系数(MFCCs)。快速傅里叶变换(FFT):对每一帧的数据应用FFT,将时域信号转换到频域。梅尔滤波器组应用:将每一帧的频谱通过梅尔滤波器组,得到梅尔频谱。对数运算:取梅尔频谱的对数,以增强低能量成分的辨别能力。原创 2023-07-12 09:38:00 · 193 阅读 · 1 评论 -
卷积神经网络介绍
除了卷积层、池化层和全连接层,CNN还包括激活函数、损失函数、优化器等组成部分。常用的激活函数有ReLU、sigmoid、tanh等;常用的损失函数有交叉熵、均方误差等;常用的优化器有随机梯度下降、Adam等。原创 2023-07-12 09:35:32 · 51 阅读 · 1 评论