NN_Audio
文章平均质量分 93
音频类模型
迪三
聚焦AIGC应用技术, 文章源于代码复现。
展开
-
音频处理1_基本概念
AI音频处理 基本概念原创 2024-06-13 12:53:57 · 1021 阅读 · 0 评论 -
音频处理2_进阶概念
本节主要对”音乐”和”人声“等概念初步整理,并过度到AI模型的讲解,本节后续会有补充或修改。原创 2024-06-18 21:50:07 · 801 阅读 · 0 评论 -
音频处理3_时域频域
本节主要讲音频的 时域 到 频域的变换和理解原创 2024-06-20 00:03:59 · 1045 阅读 · 0 评论 -
音频处理4_音高(频率) & 强度(分贝)
介绍音频:”音高”的概念,与对应频率单位,和不同频率的音频感知分类。再介绍声音”强度”的概念,即响度,对应“分贝”单位,及不同强度音频的感知和分类。原创 2024-06-27 15:26:45 · 1239 阅读 · 0 评论 -
音频处理5_傅里叶变换
傅里叶变换相关概念和代码原创 2024-06-28 01:13:49 · 902 阅读 · 0 评论 -
音频处理6_时频谱
介绍 时频表征-分析 (time-frequency representation/analysis) 常用的 时频图原创 2024-07-08 00:54:01 · 838 阅读 · 0 评论 -
音频处理7_MFCCs
短时傅里叶变换 (Short-Time Fourier Transform, STFT) 是一种时频谱转换算法,它通过在时间上移动窗口函数并计算窗口内信号的频谱来获得信号在时间和频率上的信息。填充信号可以确保每个窗口都有足够的数据进行频谱计算,特别是在窗口函数的边缘。窗口函数主要用于信号处理中的短时傅里叶变换(STFT)、滤波器设计和其他需要对信号进行窗函数处理的场景, 可减少频谱泄漏,避免傅里叶变换中的频谱混叠。原创 2024-07-08 00:50:19 · 722 阅读 · 0 评论 -
音频处理8_短时傅里叶变换
频谱特性:汉宁窗口的频谱具有较低的旁瓣(sidelobe),这意味着它能够有效地抑制频谱泄漏,主瓣(mainlobe)较宽,这会降低频率分辨率。短时傅里叶变换:STFT通过对信号进行分段,对每个片段应用汉宁窗口,能减少频谱泄漏,获得更准确的频谱信息。本节代码。原创 2024-08-05 15:59:35 · 959 阅读 · 0 评论 -
音频数据集1-LJSpeech单人语音
LJ Speech Dataset原创 2024-06-23 00:58:10 · 1049 阅读 · 0 评论 -
语音数据集2-VCTK多人音频
VCTK数据集介绍原创 2024-06-23 01:02:54 · 749 阅读 · 0 评论 -
音频模型_HiFiGAN源码解析1
HiFiGAN 解析原创 2024-07-30 14:34:55 · 635 阅读 · 0 评论 -
音频模型_HiFiGAN源码解析2
HiFiGAN-2原创 2024-07-30 14:41:06 · 647 阅读 · 0 评论