自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 用于目标说话人提取的统一视听线索

语音新手入门,学习读懂论文。本文作者机构是。

2024-08-28 15:39:30 549

原创 基于扩散的生成模型的语音增强和去噪

语音新手入门,学习读懂论文。发表于《关于音频、语音和语言处理的 IEEE/ACM 事务》本文作者。

2024-07-25 19:28:19 956

原创 Dpm-tse:目标声音提取的扩散概率模型

语音新手入门,学习读懂论文。本文作者机构是美国巴尔的摩约翰霍普金斯大学计算听觉实验室2美国巴尔的摩约翰霍普金斯大学语言与语音处理中心3香港中文大学,中国香港特别特区。

2024-07-14 13:19:03 591

原创 Svad:一个鲁棒、低功耗、轻量级的语音活动检测与尖峰神经网络

语音新手入门,学习读懂论文。本文作者机构是新加坡国立大学,天津大学,香港中文大学。

2024-05-21 10:17:17 932 2

原创 Smma-net:一种基于音频线索的目标说话人提取网络,具有谱图匹配和相互关注功能

语音新手入门,学习读懂论文。本文作者机构是信号检测与处理新疆省重点实验室,乌鲁木齐2新疆大学计算机科学与技术学院,乌鲁木齐3海思科技有限公司4清华大学电子工程系。

2024-05-10 18:59:20 968 1

原创 即插即用的MVDR波束成形语音分离

语音新手入门,学习读懂论文。本文作者机构是西北工业大学深圳研究院,西北工业大学海洋科学与技术学院,中国工商银行。

2024-04-23 22:16:08 1797 2

原创 基于多模态信息的语音处理(misp) 2023挑战:视听目标说话人提取

语音新手入门,学习读懂论文。本文作者机构是中国科学技术大学,卡内基梅隆大学,西北工业大学,科大讯飞。

2024-03-29 11:04:19 1768

原创 波束形成器制导的目标说话人提取

语音新手入门,学习读懂论文。本文作者机构是埃尔兰根国际音频实验室。

2024-03-24 11:25:22 988

原创 AV-SEPFORMER:用于视听目标说话人提取的交叉注意分隔器

语音新手入门,学习读懂论文。本文作者机构是清华大学深圳国际研究生院2北京小米公司3香港中文大学。

2024-03-14 20:37:51 967 1

原创 NLP之使用NLP和基于规则的技术进行布局感知的简历解析

语音新手入门,学习读懂论文。本文发表在2023第八届国际信息技术研究会议(ICITR),机构是信息技术学院斯里兰卡莫拉图瓦大学。

2024-03-10 10:31:35 888 1

原创 NoRefER:基于半监督语言模型微调和对比学习的自动语音识别无参考质量度量

语音新手入门,学习读懂论文。本文作者机构是。

2024-03-02 12:55:38 948

原创 CleanUNet 2:基于波形和频谱图的混合语音去噪模型

语音新手入门,学习读懂论文。本文作者机构是加利福尼亚大学和英伟达。

2024-02-24 15:09:23 1866

原创 Vocalsound:一个用于提高人类声音识别的数据集

语音新手入门,学习读懂论文。本文作者机构是麻省理工学院,美国剑桥大学。

2024-02-19 12:23:32 1105 1

原创 DCCRN-KWS:基于音频偏置的噪声鲁棒小足迹关键字识别模型

语音新手入门,学习读懂论文。本文作者机构是西北工业大学,腾讯科技有限公司。

2024-01-19 12:42:42 883 1

原创 TFECN音频分类的时频增强卷积神经网络

语音新手入门,学习读懂论文。本文作者机构是苏州大学计算机信息处理技术省级重点实验室。

2024-01-13 10:48:19 1040 1

原创 自用学习论文之EAD-CONFORMER

语音新手入门,学习读懂论文。本文作者机构是快手科技有限公司。

2023-11-29 21:54:27 864 1

原创 自用学习论文之一种用于阵列几何不可知的多通道个性化语音增强的模型

语音新手入门,学习读懂论文。本文作者机构是微软和俄亥俄州立大学。

2023-11-22 18:34:16 79 1

原创 自用学习论文之基于神经网络的实时通信啸叫检测方法

语音新手入门,学习读懂论文。本文作者机构是网易通讯音频实验室,中国浙江杭州2网易成长实验室,中国浙江杭州。

2023-11-15 12:57:21 174 1

原创 自用学习论文之具有注意机制的并行门控神经网络用于语音增强

语音新手入门,学习读懂论文。本文作者机构是南安普敦大学,英国。

2023-11-08 22:58:54 61 1

原创 自用学习论文之TRIAAN-VC

语音新手入门,学习读懂论文。本文作者机构是高丽大学产业与管理工程学院,韩国首尔。

2023-10-31 18:03:17 84 1

原创 自用学习论文之半监督声音事件检测

语音新手入门,学习读懂论文。本文作者机构是北京理工大学信息与电子学院,三星研究院。

2023-10-26 08:41:26 284

原创 自用学习论文之实时语音增强和动态注意力跨度

语音新手入门,学习读懂论文。本文作者机构是中国传媒大学和微软亚洲研究院。

2023-10-12 16:57:10 176

原创 自用学习之GRAD-STYLESPEECH

语音新手入门,学习读懂论文。AITRICS是一个由人工智能和医疗学领域的专家组成的韩国初创公司,KAIST是韩国科学研究院。

2023-09-26 22:11:15 123

原创 自用学习论文之《MSMSER》

语音新手入门,学习读懂论文。本文作者机构是。

2023-09-20 17:34:37 100 1

原创 自用学习论文之DNN

语音新手入门,学习读懂论文。本文作者机构是。

2023-09-14 17:59:34 132 1

原创 自用学习论文之DBNet

语音新手入门,学习读懂论文。本文作者机构是。

2023-09-07 13:28:07 275 1

原创 自用学习论文之CRN

语音新手入门,学习读懂论文。本文作者机构是美国俄亥俄州立大学认知与脑科学中心、汪德亮老师等。

2023-09-06 22:55:32 302 1

原创 自用记录论文学习之语音增强

语音新手入门,学习读懂论文。本文作者机构是名古屋大学信息技术中心,日本名古屋kobayashi.kazuhiro@g.sp.m.is.nagoya-u.ac.jp户田智树信息技术中心名古屋大学,日本名古屋tomoki@icts.nagoya-u.ac.jp。

2023-09-03 18:40:43 183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除