- 博客(200)
- 资源 (2)
- 收藏
- 关注
原创 语音合成和语音识别资料查询说明
文章转载请标明出处:微信公众号 低调奋进个人网站http://yqli.tech/本来整理语音合成相关的文章、数据以及相关的开源工具等等。现在,我对资料进行整理,添加了语音识别模块,在这里分享给大家,节省读者查找资料的时间。现在给大家详细说一下具体的查找页面。 一语音资料语音页面整理了语音相关的每个领域,目前主要更新TTS,ASR,DataSet,ToolKit,Lab等模块。其它的DSP,ML...
2021-10-18 17:48:11 840
原创 快上车,LLM专列:想要的资源统统给你准备好了
主要分为三块:文章、代码和数据。文章目前先放一些survey和技术报告,毕竟现在大家都喜欢发布技术报告了。数据主要是开源的中文、英文以及代码数据。代码主要是预训练、SFT和RLHF等较流行的代码库。(嘿嘿,有点标题党了。最近整理了LLM相关survey、开源数据、开源代码等等资源,后续会不断丰富内容,省略大家找资料浪费时间。闲言少叙,正式发车)网址:http://yqli.tech/page/aigc_llm.html。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
2023-10-12 20:51:11 223
原创 Is ChatGPT a general-purpose natural language processing task solver?
文章提到ChatGPT是在GPT3.5的基础上训练而来,所以在Arithmetic Reasoning、commonsense reasoning、 Symbolic reasoning、Logical reasoning 、Question Answering、Summarization和Sentiment Analysis任务进行对比。结果:ChatGPT优于GPT3.5,但比该任务微调的模型性能差。结果:ChatGPT比GPT3.5,差但比该任务的模型性能差。结果:ChatGPT差于GPT3.5。
2023-02-16 13:51:05 3844 1
原创 2023年1月语音合成(TTS)和语音识别(ASR)论文月报
2022年1~12月的语音合成和语音识别文章统计 (Awesome CgatGpt is all you need! 现在发文章不提chatgpt感觉都没人读)
2023-02-13 14:15:05 1366
原创 2022年1~11月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/
2022-12-04 17:54:37 298
原创 2022年1~10月语音合成(TTS)和语音识别(ASR)论文月报
所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。表二和图2是语音合成的具体方向文章的情况。(AIGC这么火,打算跟一下其动态,后续整理资料分享,详情后续参见http://yqli.tech/page/aigc.html)语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。
2022-11-02 20:13:39 310
原创 2022年1~9月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。语音合成的文章列表请访问http://yqli.tech/page/tts_paper.html。语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。
2022-10-08 16:27:56 241
原创 interspeech 2022 语音合成和语音识别简报
语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。表一和图二为语音合成每个研究方向的文章分布状况以及对比,由此可知声学模型、声音转换、情感合成系统、声码器、个性化和歌唱等占据绝对的优势。另外mos统计所有音频质量评估的文章,因为有相关的比赛,所以文章较多。interspeech 2022的语音识别文章有篇,具体的文章分布参见表4和图3的饼状图和柱状图。
2022-09-23 09:34:44 857
原创 2022年1~8月语音合成(TTS)和语音识别(ASR)论文月报
所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。图3是语音识别文章总数,本月有22篇,断崖式下跌(为确保搜索没有遗漏,搜了两遍,不知道是否系统出问题,相关文章很少)。语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。
2022-09-02 17:21:59 337
原创 2022年1~7月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。所有文章语音合成领域统计列表请访问http//yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http//yqli.tech/page/asr_paper.html。语音合成的文章列表请访问http//yqli.tech/page/tts_paper.html。语音识别的文章列表请访问http//yqli.tech/page/asr_paper.html。.......
2022-08-01 18:04:30 338
原创 语音识别(ASR)论文优选:全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech
TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline本文是好未来在2022.06.27更新的文章,主要开源最大的中英混合训练语料,为语音识别的Code-switching方向研究做贡献。(开源数据统计可参见http://yqli.tech/page/data.html)由于本文主要工作是开源全球最大的中英混合数据,我们就不再介绍背景,直接查看数据集的情况。该数据集为好未来
2022-07-05 11:32:27 749
原创 2022年6月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/
2022-07-04 20:21:44 360
原创 陈天奇的机器学习编译课(免费)
非广告,最近周末和晚上我都一直找公开课学习,尤其是信号与系统、数字信号处理、机器学习等等方面课程,来弥补以前缺失的课程(读研方向是graph computing,工作之前就没接触过信号、语音相关课程,甚至机器学习都没过多涉及),来构建自己的知识体系。我发现网上很多高校名师的国家级公开课,但很少有人去学习,甚是可惜。这次推荐一下陈天奇刚开的《机器学习编译》课程https://mlc.ai/summer22-zh/。随着人工智能应用在我们的日常生活中变得越来越普遍,目前存在的挑战是如何在不同的生产环境中
2022-06-20 09:42:38 392
原创 2022年5月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com
2022-06-07 10:51:29 583
原创 2022年4月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weix...
2022-05-10 14:17:10 418
原创 声纹识别:自监督学习语音识别利于声纹识别Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recogni
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixi.
2022-04-28 20:39:38 1834
原创 语音合成(TTS)论文优选:Cross-Speaker Emotion Transfer for Low-Resource Text-to-Speech Using Non-Parallel Voi
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixi.
2022-04-25 19:36:35 2354
原创 2022年3月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.q...
2022-04-01 16:57:19 2623
原创 语音合成(TTS)论文优选:视觉文本语音合成vTTS: visual-text to speech
本文提出了视觉文本到语音(vTTS),这是一种从视觉文本(即,文本作为图像)合成语音的方法。vTTS 能够生成自然度与传统 TTS 相当或更好的语音,它无需额外的标签和架构就可以将视觉文本中的重点和情感属性转移到语音中,并且对于生僻文字及集外文字更加鲁棒。
2022-03-29 17:01:17 3966
原创 神经网络大模型技术发展蓝图A Roadmap for Big Model
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weix.
2022-03-25 13:18:53 4053
原创 语音合成(TTS)论文优选:iSTFTNet: Fast and Lightweight Mel-Spectrogram Vocoder Incorporating Inverse Short-Tim
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-03-07 17:32:20 3192
原创 语音合成(TTS)论文优选:过平滑问题分析及优化Revisiting Over-Smoothness in Text to Speech
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-03-04 15:22:32 3237
原创 2022年2月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可以直接给我..
2022-03-01 15:47:48 2261 3
原创 语音识别(ASR)论文优选:性能测试Wav2Vec2.0 on the Edge: Performance Evaluation
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-02-15 16:43:01 2452
原创 语音识别(ASR)论文优选:Icassp 2022 M2MeT方案总结
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-02-11 11:50:23 2389
原创 2022年1月语音合成(TTS)和语音识别(ASR)论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可..
2022-02-07 16:28:00 303
原创 语音识别(ASR)论文优选:车内场景粤语指令数据集CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recogni
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-01-12 20:59:18 3047 2
原创 语音识别(ASR)论文优选:粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-01-10 18:08:36 2582 1
原创 语音识别(ASR)论文优选:端到端模型是否满足工业界落地需求Are E2E ASR models ready for an industrial usage?
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2022-01-07 16:06:42 2132
原创 2021年语音合成年度总结
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可以直接给我发消
2022-01-05 19:43:46 1496
原创 2021年1~12月语音合成和语音识别论文月报
论文统计每月更新一次,主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出,但不影响统计。统计过程难免存在疏漏,因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可..
2022-01-04 12:59:32 1220
原创 语音合成论文优选:Multi-speaker Multi-style Text-to-speech Synthesis With Single-speaker Single-style Trainin
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2021-12-27 17:11:08 1255 2
原创 语音开源资源优选:百度飞桨PaddleSpeech
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2021-12-23 18:58:11 3628
原创 语音识别(ASR)论文优选:自监督学习Self-Supervised Learning for speech recognition with Intermediate layer supervisi
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2021-12-20 16:16:27 1915
原创 语音信号处理论文优选:神农Shennong: a Python toolbox for audio speech features extraction
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2021-12-13 20:50:48 3352
原创 语音识别(ASR)论文优选:Training end-to-end speech-to-text models on mobile phones
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
2021-12-09 19:39:51 1605
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人