拯救世界的猫大虾-CSDN博客

本文提出了一种称为 FLGCNN 的新型全卷积神经网络 (FCN)，以解决时域中的端到端语音增强问题。所提出的 FLGCNN 主要建立在编码器和解码器之上，同时添加了额外的基于卷积的短时傅立叶变换 (CSTFT) 层和逆 STFT (CISTFT) 层来模拟正向和逆向 STFT 操作。这些层旨在将频域知识集成到所提出的模型中，因为语音的基础语音信息通过时频 (T-F) 表示更清楚地呈现。此外，编码器和解码器由门控卷积层构成，因此所提出的模型可以更好地控制层次结构中传递的信息。

2022-12-18 21:21:57 548 1

原创论文阅读：GCRN：Learning Complex Spectral Mapping With GatedConvolutional Recurrent Networks forMonaural

使用门控卷积递归网络学习复杂频谱映射以增强单声道语音

2022-12-05 22:23:08 1092

原创论文阅读：DARCN网络（个人理解）

对于连续的语音处理，动态注意有助于优先处理，因此，我们提出了一个将动态注意力和递归学习结合在一起的框架，称为 DARCN，用于单声道语音增强。

2022-11-23 17:18:15 156

weixin_44915288的博客

原创 DTW应用之关键词检测

原创 VITS整体结构介绍

原创 DTW（动态时间调整）算法原理

原创三种生成模型（GAN、VAE、FLOW）

原创小结一下参加的BirdCLEF 2023鸟声识别比赛

原创麦克风阵列语音增强算法——固定波束形成算法

原创论文阅读：DPCRN: Dual-Path Convolution Recurrent Network for Single ChannelSpeech Enhancement

原创 DTLN网络模型学习

原创论文阅读：FLGCNN: A novel fully convolutional neural network for end-to-endmonaural speech enhancement

原创论文阅读：GCRN：Learning Complex Spectral Mapping With GatedConvolutional Recurrent Networks forMonaural

原创论文阅读：DARCN网络（个人理解）

空空如也

空空如也