语音相关
文章平均质量分 87
啥哈哈哈
这个作者很懒,什么都没留下…
展开
-
LPCNET 速度优化学习
LPCNETLPCNET 包含两个部分frame rate network + sample rate network,其中sample rate network 中会用到线性估计,加入线性估计降低神经网络的复杂度(原始的WaveRNN神经网络需要给整个采样点值建模,而LPCNET的神经网络只需要估计excitation,excitation是采样点的值和线性估计之间的差值)。最后的估计的采样点值为LPC的线性估计结果+神经网络估计的excitation。LPCNET 速度优化由于sample ra原创 2021-01-26 14:57:23 · 520 阅读 · 0 评论 -
AEC传统算法学习
回声消除回声信号y(n):是扬声器播放的信号x(n)又被麦克风采集到的信号,x(n)经过了房间混响,扬声器的播放,麦克风采集之后会包含线性部分y’(n) 和非线性部分y‘’(n), y(n) = y’(n) + y’’(n) **近端麦克风采集的信号d(n) **:y(n)=s(n) + y(n)+v(n), s(n) 为近端说话人语音信号,也是真正要获得的信号,y(n) 为回声信号,v(n) 为噪声信号;回声消除的几种场景: 单讲(只有远端信号,没有近端信号),双讲(近端和远端同时有信号) 回声消原创 2021-01-04 18:54:07 · 2766 阅读 · 0 评论 -
提高降噪模型的泛化能力(包含一些噪声数据链接)
noise generalization: 提高降噪模型对噪声的泛化性,主要还是通过增加噪声数据的多样性(可以收集不同噪声数据/或对噪声数据做perturbation)噪声数据集:sound-ideas 包含各种噪声类型,但是要收费 https://www.sound-ideas.com/ freesound 做freesound的声音分类包含很多唤醒噪声:https:...原创 2020-04-14 11:20:44 · 916 阅读 · 0 评论 -
训练语音降噪模型的一些感想
当前基于深度学习的语音降噪方法主要分为两个类:基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中的基于mask的方法更常见一些,主要的是对语音提取频域特征,通过计算干净音频和对应的加噪音频的频域特征计算一个频域的mas...原创 2020-03-03 17:49:35 · 1439 阅读 · 0 评论