ASR
灵声讯
这个作者很懒,什么都没留下…
展开
-
语音信号处理领域国内外大师汇总(二)
语音信号处理领域国内外大师汇总(二) 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)haizhou li主页:https://www.researchgate.net/profile/Haizhou_Li李海洲现任新加坡国立大学电气与计算机工程系终身教授,澳大利亚新南威...原创 2020-06-23 19:51:51 · 1822 阅读 · 0 评论 -
语音情感识别
语音情感识别 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)...原创 2020-06-20 16:02:11 · 1014 阅读 · 0 评论 -
语音识别语料收集及语料库制作
语音识别语料收集及语料库制作目录 语音识别语料收集及语料库制作数据交易平台:语料库建立方法:语料库制作规范和过程:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”...原创 2019-03-22 09:48:45 · 6030 阅读 · 0 评论 -
语音识别行业技术和市场横向对比
语音识别行业技术和市场横向对比 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058) 公司简称 语音相关产品 核心技术 重点客户 备注 ...原创 2019-03-28 10:45:53 · 6348 阅读 · 1 评论 -
语音识别语料库的建立与语料收集
语音识别语料库的建立与语料收集 目录 语音识别语料库的建立与语料收集 核心需求 关键表属性 ASR-CDB逻辑结构图 维护扩张 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554...原创 2019-03-26 20:13:14 · 10611 阅读 · 1 评论 -
语音相似度打分技术说明【音频质量专题】
语音相似度打分技术说明【音频质量专题】 ...原创 2019-03-28 19:46:22 · 11909 阅读 · 2 评论 -
语音识别技术简述(概念->原理)
语音识别技术简述(概念->原理)目录语音识别技术简述(概念->原理)语音识别概念语音识别原理语音识别技术简介 1.动态时间规整(DTW) 2.支持向量机(SVM) 3.矢量量化(VQ) 4.隐马尔科夫模型(HMM) 5.高斯混合模型(GMM) 6.人工神经网络...原创 2019-04-12 10:21:44 · 26551 阅读 · 0 评论 -
基于SVM的语音情感识别系统设计
基于SVM的语音情感识别系统设计目录 基于SVM的语音情感识别系统设计1 引言2 情感语音信号的采集3. 特征参数§3.1 基音频率参数§3.3 能量参数4 语音情感的识别§4.1 采用高斯分布模型的分类§4.2 SVM分类器的原理§4.3 数据分析及整理...原创 2019-04-20 18:32:16 · 9530 阅读 · 9 评论 -
PYTORCH-KALDI语音识别工具包
PYTORCH-KALDI语音识别工具包 Mirco Ravanelli1,Titouan Parcollet2,Yoshua Bengio1 * ...翻译 2019-04-29 20:59:58 · 8330 阅读 · 2 评论 -
基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)
基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)本内容部分原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:QQ(245051943)引言.......................................................................原创 2020-06-20 16:02:41 · 7343 阅读 · 6 评论 -
基于CTC转换器的自动拼写校正端到端语音识别
基于CTC转换器的自动拼写校正端到端语音识别 Automatic Spelling Correction with Transformer for CTC-based End-to-End ...翻译 2019-09-20 18:43:02 · 1122 阅读 · 0 评论 -
语音质量评价方法-【音频质量专题】
语音质量评价方法-【音频质量专题】主要内容:1.信噪比(Signal-to-NoiseRatio,SNR)2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)3.PESQ(PerceptualEvaluationofSpeechQuality)4.对数似然比测度(Log...原创 2019-03-13 16:16:12 · 10676 阅读 · 1 评论 -
音频频率和体验知识汇总-【音频质量专题】
音频频率和体验知识汇总-【音频质量专题】主要内容:一.乐器人声频率知识二.美声-各频段处理方式三.各频段特点与评价术语部分内容来源于网络和书籍,在此先表感谢,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(6965...原创 2019-03-11 11:33:59 · 1737 阅读 · 0 评论 -
WAV2LETTER ++:最快的开源语音识别系统
WAV2LETTER ++:最快的开源语音识别系统Vineel Pratap, Awni Hannun, Qiantong Xu, Jeff Cai, Jacob Kahn, Gabriel Synnaeve,Vitaliy Liptchinsky, R...翻译 2019-03-08 16:33:15 · 3157 阅读 · 0 评论 -
语音识别技术的发展与应用
本内容原创,转载和使用请注明出处,谢谢配合;欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!原创 2019-02-01 18:03:13 · 10476 阅读 · 1 评论 -
语音识别-声纹识别-语音合成【专题一】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;原创 2019-02-02 10:14:13 · 2630 阅读 · 2 评论 -
语音识别-声纹识别-语音合成【专题二】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;原创 2019-02-02 10:19:27 · 561 阅读 · 1 评论 -
语音识别-声纹识别-语音合成【专题三】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;原创 2019-02-02 10:22:15 · 669 阅读 · 1 评论 -
语音识别-声纹识别-语音合成【专题四】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;原创 2019-02-02 10:25:19 · 579 阅读 · 0 评论 -
语音识别-声纹识别-语音合成【专题五】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;原创 2019-02-02 10:27:36 · 541 阅读 · 0 评论 -
语音信号处理领域国内外高手homepage分享(一)
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;Zheng-Hua Tan 的主页:http://kom.aau.dk/~zt/index.htm#Research%20interests (谭政华博士曾经是美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的客座科学家/教 授,...原创 2020-06-22 11:29:58 · 10675 阅读 · 2 评论 -
SoundTouch与Rubber Band Library变声算法对比与ASR结果分析
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;变声背景与目的目前基于对语音识别数据收集缓慢且质量不高的情况,内部开会决定尝试用变声算法来实现数据翻倍,前期已实现通过加不同特征的噪声实现数据翻倍,测试结果证明识别鲁棒性明显增强了。变声算法理论上可以实现任意维度的声音变化,但基于对K12口语语音识别考虑,...原创 2019-02-18 14:59:14 · 1864 阅读 · 0 评论 -
音频前后端算法-语音识别-语音合成
欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!2019年与志同道合的兄弟们在语音、音频领域干点实在的,有愿意的准备好上车。目前有开往三个方向的车,请根据实际情况选择上下车:1. 音频前后端处理算法(包括但不限于3A,均衡,麦克风阵列,混响,断点检测等)2. 语音识别(包括但不限于声纹,情感,年龄,性别,评测等)3. 语音合成(包括但不限于合成,变声,转换等)...原创 2019-02-01 13:10:52 · 4070 阅读 · 0 评论