![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别论文
文章平均质量分 74
我叫永强
欢迎关注公众号 低调奋进
展开
-
语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。(开源数据统计可参见http://yqli.tech/page/data.html)由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来原创 2022-07-05 11:32:27 · 651 阅读 · 0 评论 -
语音识别(ASR)论文优选:性能测试Wav2Vec2.0 on the Edge: Performance Evaluation
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2022-02-15 16:43:01 · 2416 阅读 · 0 评论 -
语音识别(ASR)论文优选:Icassp 2022 M2MeT方案总结
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2022-02-11 11:50:23 · 2349 阅读 · 0 评论 -
语音识别(ASR)论文优选:车内场景粤语指令数据集CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recogni
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2022-01-12 20:59:18 · 2968 阅读 · 2 评论 -
语音识别(ASR)论文优选:粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2022-01-10 18:08:36 · 2399 阅读 · 1 评论 -
语音识别(ASR)论文优选:端到端模型是否满足工业界落地需求Are E2E ASR models ready for an industrial usage?
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2022-01-07 16:06:42 · 2100 阅读 · 0 评论 -
语音识别(ASR)论文优选:自监督学习Self-Supervised Learning for speech recognition with Intermediate layer supervisi
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-12-20 16:16:27 · 1883 阅读 · 0 评论 -
语音识别(ASR)论文优选:Training end-to-end speech-to-text models on mobile phones
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-12-09 19:39:51 · 1588 阅读 · 0 评论 -
语音识别(ASR)论文优选: 数据标注错误对RNN-T影响Investigation of Training Label Error Impact on RNN-T
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-12-03 15:21:03 · 1628 阅读 · 0 评论 -
语音识别(ASR)论文优选:关注语音识别系统Fairness问题Towards Measuring Fairness in Speech Recognition
对于ASR模型的偏差研究,因此本文提供了带诸多metadata属性的闲聊Casual Conversations语音测试集,并进行ASR偏差实验和影响因素的探索,为探索更加鲁棒的识别系统做贡献。原创 2021-11-26 17:26:49 · 1109 阅读 · 0 评论 -
语音识别(ASR)论文优选:A comparison of streaming models and data augmentation methods for robust speech recog
本文对比端到端流式ASR系统Monotonic Chunkwise Attention (MoChA) 和 Recurrent Neural Network-Transducer (RNN-T)的性能以及acoustic simulator, Vocal Tract Length Perturbation (VTLP) for speaker variability, and SpecAugment等数据增广对比试验,主要为经验分享。原创 2021-11-22 13:18:03 · 1367 阅读 · 0 评论 -
语音识别(ASR)论文优选:可商用的开源30000小时ASR英文训练语料The People‘s Speech: A Large-Scale Diverse English Speech Recogn
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-11-19 16:47:26 · 2064 阅读 · 0 评论 -
语音识别(ASR)论文优选:挑战ASR规模极限Scaling ASR Improves Zero and Few Shot Learning
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-11-15 15:32:52 · 1988 阅读 · 0 评论 -
语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请原创 2021-11-04 18:34:01 · 3767 阅读 · 0 评论 -
语音识别(ASR)论文优选:Tied & Reduced RNN-T Decoder
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进Tied & Reduced RNN-T Decoder本文为google在2021.09.15发表的文章,主要的工作为优化rnn-t的decoder模型大小,使其在性能不下降的情况下,速度提高3到4倍。具体的文章链接https://arxiv.org/pdf/210原创 2021-09-18 16:18:12 · 646 阅读 · 0 评论 -
语音识别(ASR)论文优选:Adapting GPT, GPT-2 and BERT Language Models for Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进Adapting GPT, GPT-2 and BERT Language Models forSpeechRecognition本文章是剑桥大学在2021.07.29更新的文章,主要研究GPT,GPT2和Bert等预训练语言模型对语音识别的优化作用。具体的文章链接htt..原创 2021-09-14 09:52:37 · 433 阅读 · 0 评论 -
语音识别(ASR)论文优选:Scalable Data Annotation Pipeline for High-Quality Large Speech Datasets Development
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进Scalable Data Annotation Pipeline for High-Quality Large Speech Datasets Development本文是数据公司Appen在2021.09.01更新的文章,主要工作是开源了一套高效高质量的数据标注流程和语音数据原创 2021-09-06 13:08:35 · 223 阅读 · 0 评论 -
语音识别(ASR)论文优选:Dyn-ASR: Compact, Multilingual Speech Recognition via Spoken Language and Accent Ident
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进Dyn-ASR: Compact, Multilingual Speech Recognition via Spoken Language and Accent Identification本文为 Intel Corporation, Chandler, Arizona, USA原创 2021-08-10 12:29:25 · 289 阅读 · 0 评论 -
语音识别(ASR)论文优选:Streaming End-to-End ASR based on Blockwise Non-Autoregressive Models
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进Streaming End-to-End ASR based on Blockwise Non-Autoregressive Models本文为Johns Hopkins University在2021.07.20更新的文章,主要做使用blockwise和mask-ctc来优化.原创 2021-07-22 15:49:33 · 658 阅读 · 1 评论 -
语音识别(ASR)论文优选:SynthASR: Unlocking Synthetic Data for Speech Recognition
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进SynthASR: Unlocking Synthetic Data for Speech Recognition本文为Alexa Speech, Amazon.com在2021.06.14更新的文章,主要使用tts合成的语料来优化ASR,从而提高ASR的性能,具体的文章链接原创 2021-07-14 12:03:22 · 360 阅读 · 1 评论 -
语音识别(ASR)论文优选:WeNet之U2++
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进以前阅读的是语音合成相关的代码,现在有机会做一些识别相关的工作,所以接下来也会整理识别相关的资料。U2++: Unified Two-pass BidirectionalEnd-to-end Model for Speech Recognition本文是出门问问联合西北工业.原创 2021-06-16 18:56:33 · 2162 阅读 · 0 评论 -
语音识别(ASR)论文优选:WeNet
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表http://yqli.tech/page/tts_paper.html TTS 开源数据http://yqli.tech/page/data.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Tool..原创 2021-06-07 18:10:49 · 4081 阅读 · 1 评论 -
语音识别论文:Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc
声明:我主要从事语音合成,对语音识别的学习主要出于兴趣。文章内容摘如有错误,还望读者指出,共同学习进步。欢迎关注微信公众号:低调奋进Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Architectures本文2021.04.12号由德国亚琛工业大学计算机科学系发布,主要对比使用TTS合成的数据对不同ASR架构的影响,具体的文章链接https://arxiv.原创 2021-04-19 16:37:41 · 312 阅读 · 0 评论