budangdiyi-CSDN博客

原创用于目标说话人提取的统一视听线索

语音新手入门，学习读懂论文。本文作者机构是。

2024-08-28 15:39:30 549

原创基于扩散的生成模型的语音增强和去噪

语音新手入门，学习读懂论文。发表于《关于音频、语音和语言处理的 IEEE/ACM 事务》本文作者。

2024-07-25 19:28:19 956

原创 Dpm-tse:目标声音提取的扩散概率模型

语音新手入门，学习读懂论文。本文作者机构是美国巴尔的摩约翰霍普金斯大学计算听觉实验室2美国巴尔的摩约翰霍普金斯大学语言与语音处理中心3香港中文大学，中国香港特别特区。

2024-07-14 13:19:03 591

原创 Svad:一个鲁棒、低功耗、轻量级的语音活动检测与尖峰神经网络

语音新手入门，学习读懂论文。本文作者机构是新加坡国立大学，天津大学，香港中文大学。

2024-05-21 10:17:17 932 2

原创 Smma-net:一种基于音频线索的目标说话人提取网络，具有谱图匹配和相互关注功能

语音新手入门，学习读懂论文。本文作者机构是信号检测与处理新疆省重点实验室，乌鲁木齐2新疆大学计算机科学与技术学院，乌鲁木齐3海思科技有限公司4清华大学电子工程系。

2024-05-10 18:59:20 968 1

原创即插即用的MVDR波束成形语音分离

语音新手入门，学习读懂论文。本文作者机构是西北工业大学深圳研究院，西北工业大学海洋科学与技术学院，中国工商银行。

2024-04-23 22:16:08 1797 2

原创基于多模态信息的语音处理(misp) 2023挑战:视听目标说话人提取

语音新手入门，学习读懂论文。本文作者机构是中国科学技术大学，卡内基梅隆大学，西北工业大学，科大讯飞。

2024-03-29 11:04:19 1768

原创波束形成器制导的目标说话人提取

语音新手入门，学习读懂论文。本文作者机构是埃尔兰根国际音频实验室。

2024-03-24 11:25:22 988

原创 AV-SEPFORMER：用于视听目标说话人提取的交叉注意分隔器

语音新手入门，学习读懂论文。本文作者机构是清华大学深圳国际研究生院2北京小米公司3香港中文大学。

2024-03-14 20:37:51 967 1

原创 NLP之使用NLP和基于规则的技术进行布局感知的简历解析

语音新手入门，学习读懂论文。本文发表在2023第八届国际信息技术研究会议(ICITR)，机构是信息技术学院斯里兰卡莫拉图瓦大学。

2024-03-10 10:31:35 888 1

原创 NoRefER:基于半监督语言模型微调和对比学习的自动语音识别无参考质量度量

语音新手入门，学习读懂论文。本文作者机构是。

2024-03-02 12:55:38 948

原创 CleanUNet 2:基于波形和频谱图的混合语音去噪模型

语音新手入门，学习读懂论文。本文作者机构是加利福尼亚大学和英伟达。

2024-02-24 15:09:23 1866

原创 Vocalsound:一个用于提高人类声音识别的数据集

语音新手入门，学习读懂论文。本文作者机构是麻省理工学院，美国剑桥大学。

2024-02-19 12:23:32 1105 1

原创 DCCRN-KWS：基于音频偏置的噪声鲁棒小足迹关键字识别模型

语音新手入门，学习读懂论文。本文作者机构是西北工业大学，腾讯科技有限公司。

2024-01-19 12:42:42 883 1

原创 TFECN音频分类的时频增强卷积神经网络

语音新手入门，学习读懂论文。本文作者机构是苏州大学计算机信息处理技术省级重点实验室。

2024-01-13 10:48:19 1040 1

原创自用学习论文之EAD-CONFORMER

语音新手入门，学习读懂论文。本文作者机构是快手科技有限公司。

2023-11-29 21:54:27 864 1

原创自用学习论文之一种用于阵列几何不可知的多通道个性化语音增强的模型

语音新手入门，学习读懂论文。本文作者机构是微软和俄亥俄州立大学。

2023-11-22 18:34:16 79 1

原创自用学习论文之基于神经网络的实时通信啸叫检测方法

语音新手入门，学习读懂论文。本文作者机构是网易通讯音频实验室，中国浙江杭州2网易成长实验室，中国浙江杭州。

2023-11-15 12:57:21 174 1

原创自用学习论文之具有注意机制的并行门控神经网络用于语音增强

语音新手入门，学习读懂论文。本文作者机构是南安普敦大学，英国。

2023-11-08 22:58:54 61 1

原创自用学习论文之TRIAAN-VC

语音新手入门，学习读懂论文。本文作者机构是高丽大学产业与管理工程学院，韩国首尔。

2023-10-31 18:03:17 84 1

原创自用学习论文之半监督声音事件检测

语音新手入门，学习读懂论文。本文作者机构是北京理工大学信息与电子学院，三星研究院。

2023-10-26 08:41:26 284

原创自用学习论文之实时语音增强和动态注意力跨度

语音新手入门，学习读懂论文。本文作者机构是中国传媒大学和微软亚洲研究院。

2023-10-12 16:57:10 176

原创自用学习之GRAD-STYLESPEECH

语音新手入门，学习读懂论文。AITRICS是一个由人工智能和医疗学领域的专家组成的韩国初创公司，KAIST是韩国科学研究院。

2023-09-26 22:11:15 123

原创自用学习论文之《MSMSER》

语音新手入门，学习读懂论文。本文作者机构是。

2023-09-20 17:34:37 100 1

原创自用学习论文之DNN

语音新手入门，学习读懂论文。本文作者机构是。

2023-09-14 17:59:34 132 1

原创自用学习论文之DBNet

语音新手入门，学习读懂论文。本文作者机构是。

2023-09-07 13:28:07 275 1

原创自用学习论文之CRN

语音新手入门，学习读懂论文。本文作者机构是美国俄亥俄州立大学认知与脑科学中心、汪德亮老师等。

2023-09-06 22:55:32 302 1

原创自用记录论文学习之语音增强

语音新手入门，学习读懂论文。本文作者机构是名古屋大学信息技术中心，日本名古屋kobayashi.kazuhiro@g.sp.m.is.nagoya-u.ac.jp户田智树信息技术中心名古屋大学，日本名古屋tomoki@icts.nagoya-u.ac.jp。

2023-09-03 18:40:43 183

budangdiyi的博客

原创用于目标说话人提取的统一视听线索

原创基于扩散的生成模型的语音增强和去噪

原创 Dpm-tse:目标声音提取的扩散概率模型

原创 Svad:一个鲁棒、低功耗、轻量级的语音活动检测与尖峰神经网络

原创 Smma-net:一种基于音频线索的目标说话人提取网络，具有谱图匹配和相互关注功能

原创即插即用的MVDR波束成形语音分离

原创基于多模态信息的语音处理(misp) 2023挑战:视听目标说话人提取

原创波束形成器制导的目标说话人提取

原创 AV-SEPFORMER：用于视听目标说话人提取的交叉注意分隔器

原创 NLP之使用NLP和基于规则的技术进行布局感知的简历解析

原创 NoRefER:基于半监督语言模型微调和对比学习的自动语音识别无参考质量度量

原创 CleanUNet 2:基于波形和频谱图的混合语音去噪模型

原创 Vocalsound:一个用于提高人类声音识别的数据集

原创 DCCRN-KWS：基于音频偏置的噪声鲁棒小足迹关键字识别模型

原创 TFECN音频分类的时频增强卷积神经网络

原创自用学习论文之EAD-CONFORMER

原创自用学习论文之一种用于阵列几何不可知的多通道个性化语音增强的模型

原创自用学习论文之基于神经网络的实时通信啸叫检测方法

原创自用学习论文之具有注意机制的并行门控神经网络用于语音增强

原创自用学习论文之TRIAAN-VC

原创自用学习论文之半监督声音事件检测

原创自用学习论文之实时语音增强和动态注意力跨度

原创自用学习之GRAD-STYLESPEECH

原创自用学习论文之《MSMSER》

原创自用学习论文之DNN

原创自用学习论文之DBNet

原创自用学习论文之CRN

原创自用记录论文学习之语音增强

空空如也

空空如也