webrtc
灵声讯
这个作者很懒,什么都没留下…
展开
-
【WebRTC】回声抵消(aec、aecm)算法简介
【WebRTC】回声抵消(aec、aecm)算法简介webrtc 的回声抵消(aec、aecm)算法主要包括以下几个重要模块:1.回声时延估计 2.NLMS(归一化最小均方自适应算法) 3.NLP(非线性滤波) 4.CNG(舒适噪声产生),一般经典aec算法还应包括双端检测(DT)。考虑到webrtc使用的NLMS、NLP和CNG都属于经典算法范畴,故只做简略介绍,本文重点介绍webr转载 2016-06-07 11:31:53 · 1793 阅读 · 1 评论 -
线代实现:blas, lapack, cblas, clapack, armadillo, openblas, mkl
关于blas的介绍介绍见:http://www.cnblogs.com/dzyBK/p/4983953.html blas:提供向量和矩阵的基本运算,用fortran编写。lapack:提供向量和矩阵的高级运算,用fortran编写,内部以blas为基础库。 cblas:提供c接口的blas库,源码通过f2c转换为C语言。f2c官网:http://www.netlib.org/f2c/clapac...转载 2018-03-05 14:22:31 · 1036 阅读 · 0 评论 -
音频前后端算法-语音识别-语音合成
欢迎大家加入音频/识别/合成算法群(696554058)交流学习,谢谢!2019年与志同道合的兄弟们在语音、音频领域干点实在的,有愿意的准备好上车。目前有开往三个方向的车,请根据实际情况选择上下车:1. 音频前后端处理算法(包括但不限于3A,均衡,麦克风阵列,混响,断点检测等)2. 语音识别(包括但不限于声纹,情感,年龄,性别,评测等)3. 语音合成(包括但不限于合成,变声,转换等)...原创 2019-02-01 13:10:52 · 4071 阅读 · 0 评论 -
音频带宽预测与动态参数调整优化报告【音频质量专题】
音频带宽预测与动态参数调整优化报告目录 音频带宽预测与动态参数调整优化报告优化背景与目的优化内容与思路测试结果汇总A. 随机丢包网络B.带宽受限网络C.实际网络优化结论本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与...原创 2019-03-19 21:07:29 · 1738 阅读 · 0 评论 -
语音识别语料收集及语料库制作
语音识别语料收集及语料库制作目录 语音识别语料收集及语料库制作数据交易平台:语料库建立方法:语料库制作规范和过程:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵声讯音频-语音算法实验室整理创作,转载和使用请与“灵声讯”...原创 2019-03-22 09:48:45 · 6030 阅读 · 0 评论 -
语音识别技术简述(概念->原理)
语音识别技术简述(概念->原理)目录语音识别技术简述(概念->原理)语音识别概念语音识别原理语音识别技术简介 1.动态时间规整(DTW) 2.支持向量机(SVM) 3.矢量量化(VQ) 4.隐马尔科夫模型(HMM) 5.高斯混合模型(GMM) 6.人工神经网络...原创 2019-04-12 10:21:44 · 26567 阅读 · 0 评论 -
基于SVM的语音情感识别系统设计
基于SVM的语音情感识别系统设计目录 基于SVM的语音情感识别系统设计1 引言2 情感语音信号的采集3. 特征参数§3.1 基音频率参数§3.3 能量参数4 语音情感的识别§4.1 采用高斯分布模型的分类§4.2 SVM分类器的原理§4.3 数据分析及整理...原创 2019-04-20 18:32:16 · 9535 阅读 · 9 评论 -
PYTORCH-KALDI语音识别工具包
PYTORCH-KALDI语音识别工具包 Mirco Ravanelli1,Titouan Parcollet2,Yoshua Bengio1 * ...翻译 2019-04-29 20:59:58 · 8336 阅读 · 2 评论 -
连麦互动直播中混屏技术设计
连麦互动直播中混屏技术设计目录一.混屏原理二.实现混屏关键技术1. 并发解码2. 图像合成3. 视频同步4. 编码输出5. 内存管理三.具体实现流程1、混屏流程2、混屏算法四.音视频同步五.总结参考文献:本内容全原创,因作者才疏学浅,偶有纰漏,望不吝指出。本内容由灵...原创 2019-05-10 09:43:55 · 931 阅读 · 0 评论