语音识别
语音相关算法、文章、应用
sapienst
Let Data Speak
展开
-
arXiv每日推荐-5.31:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Bayesian Restoration of Audio Degraded by Low-Frequency Pulses Modeled via Gaussian Process标题:用高斯过程建模的低频脉冲退化音频的贝叶斯恢复作者: Hugo Tremonte de Carvalho, Luiz Wagner Pereira Biscainho链接:https://arxiv.org/abs/2005.14181【2】 The INTERSPEEC原创 2020-05-31 21:19:30 · 379 阅读 · 0 评论 -
arXiv每日推荐-5.16:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Semi-supervised Neural Chord Estimation Based on a Variational Autoencoder with Discrete Labels and Continuous Textures of Chords标题:基于离散标签和连续纹理的变分自动编码器的半监督神经和弦估计作者: Yiming Wu, Kazuyoshi Yoshii链接:https://arxiv.org/abs/2005.07091【2原创 2020-05-16 08:42:49 · 1379 阅读 · 0 评论 -
arXiv每日推荐-5.9:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 The Perceptimatic English Benchmark for Speech Perception Models标题:言语感知模型的感性英语基准作者: Juliette Millet, Ewan Dunbar备注:Accepted to CogSci Conference 2020链接:https://arxiv.org/abs/2005.03418【2】 Crop Aggregating for short utterances sp原创 2020-05-09 21:13:50 · 275 阅读 · 0 评论 -
arXiv每日推荐-5.5:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Addressing Missing Labels in Large-scale Sound Event Recognition using a Teacher-student Framework with Loss Masking标题:使用具有丢失掩蔽的教师-学生框架解决大规模声音事件识别中的丢失标签作者: Eduardo Fonseca, Xa...原创 2020-05-05 13:51:28 · 400 阅读 · 0 评论 -
arXiv每日推荐-4.28:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Depthwise Separable Convolutional ResNet with Squeeze-and-Excitation Blocks for Small-footprint Keyword Spotting标题:具有挤压和激励块的纵向可分离卷积共振网络用于小占地面积关键字定位作者: Menglong Xu, Xiao-Lei Zh...原创 2020-04-28 18:48:18 · 367 阅读 · 0 评论 -
arXiv每日推荐-4.24:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 A Study of Non-autoregressive Model for Sequence Generation标题:序列生成的非自回归模型研究作者: Yi Ren, Tie-Yan Liu备注:Accepted by ACL 2020链接:https://arxiv.org/abs/2004.10454【2】 Towards Link...原创 2020-04-24 09:56:15 · 425 阅读 · 0 评论 -
arXiv每日推荐-4.17:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Generating Multilingual Voices Using Speaker Space Translation Based on Bilingual Speaker Data标题:基于双语说话人数据的说话人空间翻译生成多语言语音作者: Soumi Maiti, Alistair Conkie备注:Accepted to IEEE I...原创 2020-04-17 12:44:19 · 345 阅读 · 0 评论 -
arxiv每日推荐-4.10:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 GGA-MG: Generative Genetic Algorithm for Music Generation标题:GGA-MG:音乐生成的生成性遗传算法作者: Majid Farzaneh, Rahil Mahdian Toroghi链接:https://arxiv.org/abs/2004.04687【2】 Residual Shuff...原创 2020-04-10 17:50:37 · 366 阅读 · 0 评论 -
arXiv每日推荐-4.8:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 SNR-Based Features and Diverse Training Data for Robust DNN-Based Speech Enhancement标题:用于鲁棒DNN语音增强的基于SNR的特征和多样化的训练数据作者: Robert Rehr, Timo Gerkmann链接:https://arxiv.org/abs/200...原创 2020-04-08 21:00:52 · 385 阅读 · 0 评论 -
arXiv每日推荐-3.27:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 In defence of metric learning for speaker recognition标题:为说话人识别的度量学习辩护作者: Joon Son Chung, Icksang Han链接:https://arxiv.org/abs/2003.11982【2】 Speech Quality Factors for Traditi...原创 2020-03-28 15:23:25 · 307 阅读 · 0 评论 -
arXiv每日推荐-3.24: 语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Multi-task U-Net for Music Source Separation标题:用于音乐源分离的多任务U-Net作者: Venkatesh S. Kadandale, Emilia Gómez链接:https://arxiv.org/abs/2003.10414【2】 Monaural Speech Enhancement wit...原创 2020-03-24 20:11:57 · 178 阅读 · 0 评论 -
arXiv每日推荐-3.22:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Detecting Replay Attacks Using Multi-Channel Audio: A Neural Network-Based Method标题:利用多通道音频检测重放攻击:一种基于神经网络的方法作者: Yuan Gong, Christian Poellabauer链接:https://arxiv.org/abs/2003...转载 2020-03-22 09:29:33 · 227 阅读 · 0 评论 -
arXiv每日推荐-3.19:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Detecting Replay Attacks Using Multi-Channel Audio: A Neural Network-Based Method标题:利用多通道音频检测重放攻击:一种基于神经网络的方法作者: Yuan Gong, Christian Poellabauer链接:https://arxiv.org/abs/2003...转载 2020-03-19 17:55:50 · 492 阅读 · 0 评论 -
arXiv每日推荐-3.11:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Deep Neural Networks for Automatic Speech Processing: A Survey from Large Corpora to Limited Data标题:用于自动语音处理的深度神经网络:从大型语料库到有限数据的综述作者: Vincent Roger, Julien Pinquier链接:https:/...原创 2020-03-11 07:19:22 · 221 阅读 · 0 评论 -
arXiv:每日推荐-3.9:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Wavelet-based spatial audio framework标题:基于小波的空间音频框架作者: Davide Scaini链接:https://arxiv.org/abs/2003.03287【2】 A Neural Network Based Framework for Archetypical Sound SYnthesis...原创 2020-03-09 18:35:16 · 216 阅读 · 0 评论 -
arXiv每日推荐-3.7: 语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 Overdetermined independent vector analysis标题:超定独立向量分析作者: Rintaro Ikeshita, Shoko Araki备注:To appear at the 45th International Conference on Acoustics, Speech, and Signal Proce...原创 2020-03-07 12:33:21 · 256 阅读 · 0 评论 -
arXiv每日推荐-3.4:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 SELD-TCN: Sound Event Localization & Detection via Temporal Convolutional Networks标题:SELD-TCN:基于时间卷积网络的声音事件定位与检测作者: Karim Guirguis, Bin Yang备注:5 pages, 3 tables, 2 figure...原创 2020-03-04 20:04:50 · 353 阅读 · 0 评论 -
arXiv每日推荐-3.2:语音/音频每日论文速递
同步公众号(arXiv每日学术速递)【1】 A.I. based Embedded Speech to Text Using Deepspeech标题:使用DeepSpeech的基于人工智能的嵌入式语音到文本作者: Muhammad Hafidh Firmansyah, Gul Malik Urfa链接:https://arxiv.org/abs/2002.12830【2】 Deep R...原创 2020-03-02 14:09:37 · 226 阅读 · 0 评论 -
arXiv每日文章推荐:语音/音频每日论文速递[02.28]
参考原文:https://zhuanlan.zhihu.com/p/109644569同步公众号(arXiv每日学术速递)【1】 SkinAugment: Auto-Encoding Speaker Conversions for Automatic Speech Translation标题:SkinAugment:用于自动语音翻译的自动编码说话人转换作者: Arya D. McCarth...原创 2020-02-28 14:53:47 · 235 阅读 · 0 评论 -
arXiv每日推荐:语音/音频每日论文速递[02.25]
【1】 Rhythm, Chord and Melody Generation for Lead Sheets using Recurrent Neural Networks标题:用递归神经网络生成铅片的节奏、和弦和旋律作者: Cedric De Boom, Bart Dhoedt链接:https://arxiv.org/abs/2002.10266【2】 DECIBEL: Improvi...原创 2020-02-26 10:29:16 · 283 阅读 · 0 评论