- 博客(32)
- 资源 (16)
- 收藏
- 关注
原创 音频编解码介绍(最全v1.0)
音频编解码介绍(最全v1.0)目录:1.PCMU(G.711U)2.PCMA(G.711A)3.ADPCM4.LPC(Linear Predictive Coding)5.CELP(Code Excited Linear Prediction)6.G.7117.G.7218.G.7229.G.72310.G.723.111.G.72812.G.72913.G.729A14.GIPS15.SILK16.NICAM(Near ...
2020-12-18 21:06:24 7108 3
原创 语音信号处理领域国内外大师汇总(二)
语音信号处理领域国内外大师汇总(二) 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)haizhou li主页:https://www.researchgate.net/profile/Haizhou_Li李海洲现任新加坡国立大学电气与计算机工程系终身教授,澳大利亚新南威...
2020-06-23 19:51:51 1853
原创 语音信号处理领域国内外高手homepage分享(一)
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;Zheng-Hua Tan 的主页:http://kom.aau.dk/~zt/index.htm#Research%20interests (谭政华博士曾经是美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的客座科学家/教 授,...
2020-06-22 11:29:58 10753 2
原创 matlab在多媒体算法处理中的应用
欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本文主要是用matlab完成各色物品的制作,通过编程熟悉matlab的基本用法,本文原创,转载和使用请注明出处;所有的源码都可以通过关注公众号(天一色)获取。%-------------------------大花瓶——————————————————————%------------------制作...
2020-06-20 16:03:32 810
原创 基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)
基于DTW的孤立词语音识别系统(文档+MATLAB+GUI)本内容部分原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:QQ(245051943)引言.......................................................................
2020-06-20 16:02:41 7410 6
原创 语音情感识别
语音情感识别 本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)...
2020-06-20 16:02:11 1035
翻译 基于CTC转换器的自动拼写校正端到端语音识别
基于CTC转换器的自动拼写校正端到端语音识别 Automatic Spelling Correction with Transformer for CTC-based End-to-End ...
2019-09-20 18:43:02 1141
原创 从发声机理到听觉感知认识声音的本质
从发声机理到听觉感知认识声音的本质本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058)§1.1 语音产生与感知语音信号的产生和感知对应不同的数学模型,为了处理和实现更加简便,要求数学模型应...
2019-07-02 20:10:21 4199
原创 连麦互动直播中混屏技术设计
连麦互动直播中混屏技术设计目录一.混屏原理二.实现混屏关键技术1. 并发解码2. 图像合成3. 视频同步4. 编码输出5. 内存管理三.具体实现流程1、混屏流程2、混屏算法四.音视频同步五.总结参考文献:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵...
2019-05-10 09:43:55 980
翻译 PYTORCH-KALDI语音识别工具包
PYTORCH-KALDI语音识别工具包 Mirco Ravanelli1,Titouan Parcollet2,Yoshua Bengio1 * ...
2019-04-29 20:59:58 8362 2
原创 基于SVM的语音情感识别系统设计
基于SVM的语音情感识别系统设计目录 基于SVM的语音情感识别系统设计1 引言2 情感语音信号的采集3. 特征参数§3.1 基音频率参数§3.3 能量参数4 语音情感的识别§4.1 采用高斯分布模型的分类§4.2 SVM分类器的原理§4.3 数据分析及整理...
2019-04-20 18:32:16 9586 9
原创 语音识别技术简述(概念->原理)
语音识别技术简述(概念->原理)目录语音识别技术简述(概念->原理)语音识别概念语音识别原理语音识别技术简介 1.动态时间规整(DTW) 2.支持向量机(SVM) 3.矢量量化(VQ) 4.隐马尔科夫模型(HMM) 5.高斯混合模型(GMM) 6.人工神经网络...
2019-04-12 10:21:44 26851
原创 语音识别行业技术和市场横向对比
语音识别行业技术和市场横向对比 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554058) 公司简称 语音相关产品 核心技术 重点客户 备注 ...
2019-03-28 10:45:53 6400 1
原创 语音识别语料库的建立与语料收集
语音识别语料库的建立与语料收集 目录 语音识别语料库的建立与语料收集 核心需求 关键表属性 ASR-CDB逻辑结构图 维护扩张 本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(696554...
2019-03-26 20:13:14 10678 1
原创 音频带宽预测与动态参数调整优化报告【音频质量专题】
音频带宽预测与动态参数调整优化报告目录 音频带宽预测与动态参数调整优化报告优化背景与目的优化内容与思路测试结果汇总A. 随机丢包网络B.带宽受限网络C.实际网络优化结论本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与...
2019-03-19 21:07:29 1773
原创 语音质量评价方法-【音频质量专题】
语音质量评价方法-【音频质量专题】主要内容:1.信噪比(Signal-to-NoiseRatio,SNR)2.分段信噪比(Segment Signal-to-Noise Ratio,SegSNR)3.PESQ(PerceptualEvaluationofSpeechQuality)4.对数似然比测度(Log...
2019-03-13 16:16:12 10770 1
原创 音频频率和体验知识汇总-【音频质量专题】
音频频率和体验知识汇总-【音频质量专题】主要内容:一.乐器人声频率知识二.美声-各频段处理方式三.各频段特点与评价术语部分内容来源于网络和书籍,在此先表感谢,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群(6965...
2019-03-11 11:33:59 1798
翻译 WAV2LETTER ++:最快的开源语音识别系统
WAV2LETTER ++:最快的开源语音识别系统Vineel Pratap, Awni Hannun, Qiantong Xu, Jeff Cai, Jacob Kahn, Gabriel Synnaeve,Vitaliy Liptchinsky, R...
2019-03-08 16:33:15 3175
原创 SoundTouch与Rubber Band Library变声算法对比与ASR结果分析
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;变声背景与目的目前基于对语音识别数据收集缓慢且质量不高的情况,内部开会决定尝试用变声算法来实现数据翻倍,前期已实现通过加不同特征的噪声实现数据翻倍,测试结果证明识别鲁棒性明显增强了。变声算法理论上可以实现任意维度的声音变化,但基于对K12口语语音识别考虑,...
2019-02-18 14:59:14 1886
原创 语音识别-声纹识别-语音合成【专题五】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;
2019-02-02 10:27:36 555
原创 语音识别-声纹识别-语音合成【专题四】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;
2019-02-02 10:25:19 589
原创 语音识别-声纹识别-语音合成【专题三】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;
2019-02-02 10:22:15 683 1
原创 语音识别-声纹识别-语音合成【专题二】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;
2019-02-02 10:19:27 573 1
原创 语音识别-声纹识别-语音合成【专题一】
详细内容见群文件,欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!本内容原创,转载和使用请注明出处,谢谢配合;
2019-02-02 10:14:13 2675 2
原创 语音识别技术的发展与应用
本内容原创,转载和使用请注明出处,谢谢配合;欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!
2019-02-01 18:03:13 10533 1
原创 音频前后端算法-语音识别-语音合成
欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!2019年与志同道合的兄弟们在语音、音频领域干点实在的,有愿意的准备好上车。目前有开往三个方向的车,请根据实际情况选择上下车:1. 音频前后端处理算法(包括但不限于3A,均衡,麦克风阵列,混响,断点检测等)2. 语音识别(包括但不限于声纹,情感,年龄,性别,评测等)3. 语音合成(包括但不限于合成,变声,转换等)...
2019-02-01 13:10:52 4105
原创 【基于MATLAB 的VQ声纹识别系统】
基于MATLAB 的VQ声纹识别系统本内容由灵声讯音频-语音算法实验室整理,转载和使用请与“灵声讯”联系,联系方式:音频/识别/合成算法QQ群目 录摘 要.......................................................................................................... IABSTRACT. II第1章 引 言... 11.1语音识别的背景...
2022-01-28 12:19:30 4492
原创 音频带宽预测与动态参数调整优化报告
音频带宽预测与动态参数调整优化报告优化背景与目的基于18年8月份对listensin项目开发,还存在弱网络环境下动态参数调整不合理或不匹配的情况,导致点对点音频质量下降明显造成沟通不畅等问题,近期在依照友商产品体验的基础上进行全方位优化和改善。经过多轮反复试验,最终在原来优化的基础上增加了音频带宽估计和探测模块,实时探测网络状态以此来增加动态参数调整的精准...
2022-01-28 12:07:50 362
原创 语音识别语料收集及语料库制作
语音识别语料收集及语料库制作目录 语音识别语料收集及语料库制作数据交易平台:语料库建立方法:语料库制作规范和过程:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”...
2019-03-22 09:48:45 6071
转载 线代实现:blas, lapack, cblas, clapack, armadillo, openblas, mkl
关于blas的介绍介绍见:http://www.cnblogs.com/dzyBK/p/4983953.html blas:提供向量和矩阵的基本运算,用fortran编写。lapack:提供向量和矩阵的高级运算,用fortran编写,内部以blas为基础库。 cblas:提供c接口的blas库,源码通过f2c转换为C语言。f2c官网:http://www.netlib.org/f2c/clapac...
2018-03-05 14:22:31 1056
转载 【WebRTC】回声抵消(aec、aecm)算法简介
【WebRTC】回声抵消(aec、aecm)算法简介webrtc 的回声抵消(aec、aecm)算法主要包括以下几个重要模块:1.回声时延估计 2.NLMS(归一化最小均方自适应算法) 3.NLP(非线性滤波) 4.CNG(舒适噪声产生),一般经典aec算法还应包括双端检测(DT)。考虑到webrtc使用的NLMS、NLP和CNG都属于经典算法范畴,故只做简略介绍,本文重点介绍webr
2016-06-07 11:31:53 1872 1
桂林电子科技大学2017年研究生入学考试试卷(所有学院考试科目)
2018-10-22
人工智能白皮书-最新信通院整理2018-9月
2018-09-29
人机交互新场景的 12 个新机会报告暨 WARE 2018 大会回顾
2018-06-22
AAC转PCM工具包(python批处理)
2018-06-14
语音分割_语音质量客观打分工具(mos_pesq)
2018-06-14
中国共享经济发展报告(2017-2018)
2018-06-04
HTK中文版详细教程(最新版)
2018-05-18
人工智能标准化白皮书(2018最新版)
2018-05-18
人工智能相关领域算法职位猎头必备知识(精简版上册-深圳新丰收教育科技有限公司出品)
2018-05-09
高数-概率-线代-矩阵分析-随机过程(深度学习基础知识)
2018-05-09
webrtc2017全球技术峰会所有大牛ppt
2018-05-09
天一色科技—AI+应用于垂直领域,如何改善这八大行业2018.5
2018-05-09
视觉机器学习20讲原版影印书和源代码matlab.rar
2018-05-09
AI行业应用价值报告
2018-05-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人