我叫永强-CSDN博客

原创语音合成和语音识别资料查询说明

文章转载请标明出处：微信公众号低调奋进个人网站http://yqli.tech/本来整理语音合成相关的文章、数据以及相关的开源工具等等。现在，我对资料进行整理，添加了语音识别模块，在这里分享给大家，节省读者查找资料的时间。现在给大家详细说一下具体的查找页面。一语音资料语音页面整理了语音相关的每个领域，目前主要更新TTS，ASR，DataSet，ToolKit，Lab等模块。其它的DSP，ML...

2021-10-18 17:48:11 918

原创快上车，LLM专列：想要的资源统统给你准备好了

主要分为三块:文章、代码和数据。文章目前先放一些survey和技术报告，毕竟现在大家都喜欢发布技术报告了。数据主要是开源的中文、英文以及代码数据。代码主要是预训练、SFT和RLHF等较流行的代码库。(嘿嘿，有点标题党了。最近整理了LLM相关survey、开源数据、开源代码等等资源，后续会不断丰富内容，省略大家找资料浪费时间。闲言少叙，正式发车）网址：http://yqli.tech/page/aigc_llm.html。如有转载，请注明出处。欢迎关注微信公众号：低调奋进。

2023-10-12 20:51:11 305

原创 LLM文章阅读：Baichuan 2 干货

LLM文章阅读：Baichuan 2 干货

2023-09-07 20:13:21 653 1

原创 Is ChatGPT a general-purpose natural language processing task solver?

文章提到ChatGPT是在GPT3.5的基础上训练而来，所以在Arithmetic Reasoning、commonsense reasoning、 Symbolic reasoning、Logical reasoning 、Question Answering、Summarization和Sentiment Analysis任务进行对比。结果：ChatGPT优于GPT3.5,但比该任务微调的模型性能差。结果：ChatGPT比GPT3.5,差但比该任务的模型性能差。结果：ChatGPT差于GPT3.5。

2023-02-16 13:51:05 4016

原创 2023年1月语音合成（TTS)和语音识别(ASR)论文月报

2022年1~12月的语音合成和语音识别文章统计（Awesome CgatGpt is all you need! 现在发文章不提chatgpt感觉都没人读）

2023-02-13 14:15:05 1601

原创 2022年语音合成（TTS)和语音识别(ASR)年度总结

2022年语音合成和语音识别文章年度总结

2023-01-08 21:08:02 1714

原创 2022年1~11月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/

2022-12-04 17:54:37 378

原创 2022年1~10月语音合成（TTS)和语音识别(ASR)论文月报

所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。表二和图2是语音合成的具体方向文章的情况。（AIGC这么火，打算跟一下其动态，后续整理资料分享，详情后续参见http://yqli.tech/page/aigc.html）语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。

2022-11-02 20:13:39 436

原创 2022年1~9月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。语音合成的文章列表请访问http://yqli.tech/page/tts_paper.html。语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。

2022-10-08 16:27:56 333

原创 interspeech 2022 语音合成和语音识别简报

语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。表一和图二为语音合成每个研究方向的文章分布状况以及对比，由此可知声学模型、声音转换、情感合成系统、声码器、个性化和歌唱等占据绝对的优势。另外mos统计所有音频质量评估的文章，因为有相关的比赛，所以文章较多。interspeech 2022的语音识别文章有篇，具体的文章分布参见表4和图3的饼状图和柱状图。

2022-09-23 09:34:44 1093

原创 2022年1~8月语音合成（TTS)和语音识别(ASR)论文月报

所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。图3是语音识别文章总数，本月有22篇，断崖式下跌（为确保搜索没有遗漏，搜了两遍，不知道是否系统出问题，相关文章很少）。语音识别的文章列表请访问http://yqli.tech/page/asr_paper.html。

2022-09-02 17:21:59 430

原创 2022年1~7月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。所有文章语音合成领域统计列表请访问http//yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http//yqli.tech/page/asr_paper.html。语音合成的文章列表请访问http//yqli.tech/page/tts_paper.html。语音识别的文章列表请访问http//yqli.tech/page/asr_paper.html。.......

2022-08-01 18:04:30 446

原创语音识别(ASR)论文优选：全球最大的中英混合开源数据TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech

TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline本文是好未来在2022.06.27更新的文章，主要开源最大的中英混合训练语料，为语音识别的Code-switching方向研究做贡献。（开源数据统计可参见http://yqli.tech/page/data.html）由于本文主要工作是开源全球最大的中英混合数据，我们就不再介绍背景，直接查看数据集的情况。该数据集为好未来

2022-07-05 11:32:27 1504

原创 2022年6月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/

2022-07-04 20:21:44 455

原创陈天奇的机器学习编译课（免费）

非广告，最近周末和晚上我都一直找公开课学习，尤其是信号与系统、数字信号处理、机器学习等等方面课程，来弥补以前缺失的课程（读研方向是graph computing，工作之前就没接触过信号、语音相关课程，甚至机器学习都没过多涉及），来构建自己的知识体系。我发现网上很多高校名师的国家级公开课，但很少有人去学习，甚是可惜。这次推荐一下陈天奇刚开的《机器学习编译》课程https://mlc.ai/summer22-zh/。随着人工智能应用在我们的日常生活中变得越来越普遍，目前存在的挑战是如何在不同的生产环境中

2022-06-20 09:42:38 499

原创煮酒论开源语音工具包

开源语音工具包

2022-06-13 12:22:18 1144

原创 ICASSP 2022 语音合成和语音识别简报

icassp 2022语音合成和识别

2022-06-09 18:42:25 2282

原创 2022年5月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com

2022-06-07 10:51:29 688

原创 2022年4月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weix...

2022-05-10 14:17:10 516

原创声纹识别：自监督学习语音识别利于声纹识别Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recogni

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixi.

2022-04-28 20:39:38 2065

原创语音合成(TTS)论文优选：Cross-Speaker Emotion Transfer for Low-Resource Text-to-Speech Using Non-Parallel Voi

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixi.

2022-04-25 19:36:35 2540

原创 2022年3月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.q...

2022-04-01 16:57:19 2734

原创语音合成(TTS)论文优选：视觉文本语音合成vTTS: visual-text to speech

本文提出了视觉文本到语音（vTTS），这是一种从视觉文本（即，文本作为图像）合成语音的方法。vTTS 能够生成自然度与传统 TTS 相当或更好的语音，它无需额外的标签和架构就可以将视觉文本中的重点和情感属性转移到语音中，并且对于生僻文字及集外文字更加鲁棒。

2022-03-29 17:01:17 4224

原创神经网络大模型技术发展蓝图A Roadmap for Big Model

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weix.

2022-03-25 13:18:53 4253

原创语音合成(TTS)论文优选：iSTFTNet: Fast and Lightweight Mel-Spectrogram Vocoder Incorporating Inverse Short-Tim

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-03-07 17:32:20 3298

原创语音合成（TTS）论文优选：过平滑问题分析及优化Revisiting Over-Smoothness in Text to Speech

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-03-04 15:22:32 3404

原创 2022年2月语音合成（TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。读者有什么建议可以直接给我..

2022-03-01 15:47:48 2431 3

原创语音识别(ASR)论文优选：性能测试Wav2Vec2.0 on the Edge: Performance Evaluation

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-02-15 16:43:01 2711

原创语音识别(ASR)论文优选：Icassp 2022 M2MeT方案总结

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-02-11 11:50:23 2577

原创 2022年1月语音合成(TTS)和语音识别(ASR)论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。读者有什么建议可..

2022-02-07 16:28:00 402

原创语音识别(ASR)论文优选：车内场景粤语指令数据集CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recogni

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-01-12 20:59:18 3589 2

原创语音识别(ASR)论文优选：粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-01-10 18:08:36 3434 1

原创语音识别(ASR)论文优选：端到端模型是否满足工业界落地需求Are E2E ASR models ready for an industrial usage?

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2022-01-07 16:06:42 2315

原创 2021年语音合成年度总结

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。读者有什么建议可以直接给我发消

2022-01-05 19:43:46 1616

原创 2021年1~12月语音合成和语音识别论文月报

论文统计每月更新一次，主要跟踪语音合成和语音识别的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考。所有文章语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。读者有什么建议可..

2022-01-04 12:59:32 1282

原创语音合成论文优选：Multi-speaker Multi-style Text-to-speech Synthesis With Single-speaker Single-style Trainin

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2021-12-27 17:11:08 1335 2

原创语音开源资源优选：百度飞桨PaddleSpeech

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2021-12-23 18:58:11 3916

原创语音识别(ASR)论文优选：自监督学习Self-Supervised Learning for speech recognition with Intermediate layer supervisi

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2021-12-20 16:16:27 2137

原创语音信号处理论文优选：神农Shennong: a Python toolbox for audio speech features extraction

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2021-12-13 20:50:48 3494

原创语音识别(ASR)论文优选：Training end-to-end speech-to-text models on mobile phones

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请

2021-12-09 19:39:51 1736

repo主要用于下载android源码

jre-6u45-linux-x64.bin

空空如也