自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_52631753的博客

等待整个冬天 CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

111万+: 周排名

11万+: 总排名

1万+: 访问

: 等级

314: 积分

121: 粉丝

172: 获赞

12: 评论

238: 收藏

私信

关注

热门文章

分类专栏

声音识别 6篇
笔记 3篇
stm32f4 1篇

最新评论

基于深度学习的语音信号处理基础
等待整个冬天: 这是GPT生成的？
基于深度学习的语音信号处理基础
忍山: 上面这段话描述的是如何使用傅里叶变换（Fourier Transform）从时域信号中提取频域信息，并计算频率间隔。这里使用了一个特定的例子来解释这个过程。我将一步步地详细解释这个过程： 1. **窗长和采样率**: 这里提到的“窗长=320，SR=16000”意味着我们正在分析的信号段包含320个样本点，且整个信号的采样率（每秒采样次数）是16000Hz。采样率决定了能够观测到的最高频率（根据奈奎斯特定理，最高可观测频率为采样率的一半，即8000Hz）。 2. **窗口时间长度**：窗口时间长度是通过将窗长除以采样率来计算的。在这个例子中，窗口时间长度是0.02秒（即320/16000）。这表示分析的这段信号持续了0.02秒。 3. **频率组间隔**：频率组间隔（即频率分辨率）由窗口时间长度的倒数决定。在这个例子中，频率组间隔是50Hz（即1/0.02）。这意味着在傅里叶变换的结果中，每个频率分量间的间隔是50Hz。在傅里叶变换中，信号被分解为一系列正弦波，每个正弦波的频率和振幅都不同。频率组间隔越小，就越能分辨出相邻频率较为接近的正弦波。频率组间隔由窗口时间长度的倒数决定。在您的例子中，窗口时间长度为0.02秒，因此频率组间隔为50Hz。 4. **频率组的频率**：在进行傅里叶变换时，如果设置`n_fft=256`，则意味着将信号分为256个频率组。但由于实数信号的傅里叶变换是对称的，只有一半的频率组是独特的，即`n_fft / 2 + 1 = 129`个频率组。这些频率组从0Hz开始，每个频率组间隔50Hz。因此，频率组的频率是50Hz, 100Hz, 150Hz, ... 直到(129 * 50Hz)。 5. **傅里叶算法的应用**：最后，使用傅里叶算法，可以计算出在这些特定频率上信号的幅度和相位。这是通过将时域信号转换为频域来实现的，结果可以告诉我们信号在不同频率上的强度和相位偏移。简而言之，这段话描述了如何从一个时长为0.02秒的信号中，使用傅里叶变换来提取和分析频率成分，以及如何计算这些频率成分的间隔和具体数值。频率组间隔（即频率分辨率）是指傅里叶变换结果中，两个相邻频率分量之间的间隔。它是一个重要的指标，用于衡量傅里叶变换的分辨能力。
基于深度学习的语音信号处理基础
忍山: 傅里叶变换（FFT）是一种用于分析信号频率成分的算法。当我们对一个信号进行傅里叶变换时，我们通常使用一个固定大小的窗口来查看信号。这个窗口的大小称为FFT大小或`n_fft`。`n_fft`表示在进行变换时考虑的样本点数。在傅里叶变换中，当我们对一个长度为`n_fft`的信号序列进行变换时，得到的结果是一个复数数组，其长度也为`n_fft`。这个结果数组中的每个元素对应于不同的频率成分。然而，并非这些所有频率成分都是唯一的或有用的。对于实数输入信号，傅里叶变换的结果是对称的。这意味着结果的一半是另一半的镜像。因此，只有一半的频率成分是唯一的。更具体地说，对于`n_fft`点的FFT，唯一的频率成分数是`n_fft / 2 + 1`。这是因为： - 对于偶数`n_fft`：有`n_fft / 2`个正频率和`n_fft / 2`个负频率，加上一个直流分量（频率为0）。 - 对于奇数`n_fft`：有`(n_fft - 1) / 2`个正频率和`(n_fft - 1) / 2`个负频率，再加上一个直流分量和一个Nyquist频率分量。在实际应用中，通常我们只对正频率感兴趣，所以我们取`n_fft / 2 + 1`个频率成分。这就是为什么频率组数等于`n_fft / 2 + 1`的原因。
Attention注意力机制综述（二）--多头自注意力机制（含代码）Multi-head Self-Attention Machanism
等待整个冬天: 这个印象不深了，感觉影响不大，都可以吧，实现方式不同人稍微有些差别
Attention注意力机制综述（二）--多头自注意力机制（含代码）Multi-head Self-Attention Machanism
编程爱好者ccc: 博主，有个问题请教。从q1到q11的过程中有没有再乘其他权重矩阵w‘，我看李宏毅老师视频说这个过程又乘了另外一个权重矩阵，而很多博主和代码都没有乘，都是使用view实现的。

最新文章

声音识别

关注

文章平均质量分 85

关注数：文章数：6 文章阅读量：5326 文章收藏量：98

作者: 等待整个冬天

AI芯片研究僧

展开