语音特征
文章平均质量分 58
西岸行者
问君能有几多愁,恰似一只鸡腿进不了口
展开
-
AMR文件怎么存储的
amr是3gpp开发的语音编码规范,初衷是用在3g语音通信,但没想到3g是如此的昙花一现。原创 2022-02-09 20:15:06 · 1556 阅读 · 0 评论 -
Zero shot Learning 论文学习笔记(未完待续)
我跨过山河大海,也穿过人山人海......前面还是高山大海,人山人海。初入机器学习的大门,爬上DEEPLEARNING的高山,发现前面还是高山,更多,更高,更难爬......ZST就是一座待爬的高山,很显然,“不学习就会ZST”,“或者一学就会OST”的愿景是美好的,正如小时候看的武侠小说和电影里讲的回梦心经等等神奇武功,但现实却告诉你,要想达成这样的本领,你要学的就更多了,学多了就可以触类旁通,事半功倍,机器学习也是这个道理。原创 2020-10-19 19:17:04 · 1654 阅读 · 1 评论 -
阅读理解:Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis
阅读理解:Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis前言二级目录三级目录前言现在银行打来的电话,还有很多骚扰电话已经完全用自动语音服务来实现了,此处回顾一下语音服务的三大技术基础:TTS、ASR、SI/SV。伴随着DL技术的广泛应用,现在自动对话系统的体验越来越好,三项技术在DL引擎的驱动下,日新月异的发展,未来你通过电话想知道对方是不是人会很难的(现在银行打来的自动语音电话已经原创 2020-09-09 11:05:36 · 1105 阅读 · 0 评论 -
声纹识别背景学习
声纹, voiceprint,这个词听上去很神秘,可能主要使用因为虽然这个词汇来自于指纹,但是它真正长什么样是无法直观获取的原因吧,加之一些一知半解的玄幻广告,把这个词汇吹得神乎其神,其实可以理解为从人类声音提取的一组生物学特征,只是这个特征真的不如指纹那么直观,不仅仅决定于某个人发声器官的特性(没有两个人长得一模一样,也没有人的发声器官长得一幕一眼),而且受到了年龄、健康状况、心理状态、环境等等因素共同影响的。原创 2020-07-15 14:47:48 · 913 阅读 · 0 评论 -
浅析mel滤波的快速计算
浅析mel滤波的快速计算基本计算方法快速计算方法矩阵计算方法迭代计算方法基本计算方法快速计算方法矩阵计算方法迭代计算方法原创 2020-07-09 14:18:01 · 1062 阅读 · 0 评论 -
CORDIC-NO MULTIPLY trigonometric and hyperbolic implementation
CORDIC-NO MULTIPLY trigonometric and hyperbolic implementationreference二级目录三级目录reference三角函数计算,Cordic 算法入门CORDIC in C and Javascript Software Implementation of Trigonometric Functions Using CORDIC AlgorithmSimple C source for CORDIC An Introduction t原创 2020-06-24 15:10:15 · 152 阅读 · 0 评论 -
语音特性提取回顾-从mel定标到mfc和mfcc
从mel定标到mfc和mfcc前言Mel 定标Mel滤波器组离散傅里叶变换Mel滤波器组实现插值MFC差了一个C前言做语音识别的真谛是不漏听一句话,不错听一句话,但能做到着实不易。拿漏听来说吧,用经典数学的方法和概率统计的方法虽然大大提高了识别率,但依然有漏网纸鱼,而且有的漏网纸鱼人类却觉得这句话很正常啊?!。。。。然而对于识别体统来说,它就是一个异类,那么这个异类这么个不一样了?我们还得剥茧抽丝,从语音,从属性提取来说起,本文重新分析思考MFCC的核心,Mel是干啥滴,在DNN时代还没过时吗?以及是否原创 2020-05-20 16:45:38 · 760 阅读 · 0 评论 -
语音特征提取学习笔记--对比kaldi、htk、w2l的语音提取过程。
任何模式识别系统的第一个问题都是选择什么样的特征作为系统的输入,与语音识别也不例外,为了准确地反映待测系统的特性,并且让识别系统本身容易处理和分类,语音专家经过了几十年的研究,各种各样的语音特性提取也被提出来,而在经典的GMM-HMM模型中,MFCC是绝对的C位。不过在KALDI和HTK软件中,除了MFCC,其实还提供了其他一些特性提取方法,其中就包括PLP和FilterBank。本文又加入了w2l,目前最流行的开源人工智能网络ASR工具集,横向比较中,了解和学习一下语音提取技术的特点和发展。原创 2019-09-26 11:05:15 · 3373 阅读 · 0 评论 -
从wav2letter中提取语音属性的代码
从wav2letter中提取语音属性的代码前文中已经对比了三种语音识别平台关于语音特性提取的代码框架和大致结构,因为wav2letter的代码整洁易懂,同时又调用了cblas和fftw两个外部的库提高矩阵和fft的运行效率,比较适合做进一步的分析和学习。代码提取语音特征提取的代码在/src/libraries/features目录,目录内的文件如下-rw-rw-r-- 1 1251 9月 ...原创 2019-10-09 16:33:21 · 341 阅读 · 0 评论