- 博客(11)
- 收藏
- 关注
原创 DTW应用之关键词检测
热词检测(Hotword Detection)是一种语音识别技术,用于检测特定的短语或单词,例如“Hey Siri”、“OK Google”、“Alexa"等,以触发相应的语音助手或应用程序。计算训练语音特征和测试语音特征之间的相似性,即分别计算DTW距离,找到最小的DTW距离并对比阈值得出结果。
2024-03-25 22:06:07 213
原创 论文阅读:DPCRN: Dual-Path Convolution Recurrent Network for Single ChannelSpeech Enhancement
将 DPRNN 模块与卷积递归网络 (CRN) 相结合,设计了一种称为双路径卷积递归网络 (DPCRN) 的模型,用于时频域中的语音增强
2023-01-12 21:40:54 1277 3
原创 论文阅读:FLGCNN: A novel fully convolutional neural network for end-to-endmonaural speech enhancement
本文提出了一种称为 FLGCNN 的新型全卷积神经网络 (FCN),以解决时域中的端到端语音增强问题。所提出的 FLGCNN 主要建立在编码器和解码器之上,同时添加了额外的基于卷积的短时傅立叶变换 (CSTFT) 层和逆 STFT (CISTFT) 层来模拟正向和逆向 STFT 操作。这些层旨在将频域知识集成到所提出的模型中,因为语音的基础语音信息通过时频 (T-F) 表示更清楚地呈现。此外,编码器和解码器由门控卷积层构成,因此所提出的模型可以更好地控制层次结构中传递的信息。
2022-12-18 21:21:57 548 1
原创 论文阅读:GCRN:Learning Complex Spectral Mapping With GatedConvolutional Recurrent Networks forMonaural
使用门控卷积递归网络学习复杂频谱映射以增强单声道语音
2022-12-05 22:23:08 1092
原创 论文阅读:DARCN网络(个人理解)
对于连续的语音处理,动态注意有助于优先处理,因此,我们提出了一个将动态注意力和递归学习结合在一起的框架,称为 DARCN,用于单声道语音增强。
2022-11-23 17:18:15 156
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人