语音识别
夜空骑士
我是一名数据玩家,对数据行业的知识有着极大的学习热情,在数据分析、数据挖掘、大数据、人工智能等多个方面均有所涉猎,致力于将数据技术应用于各个行业领域,不断提升自我、完善自我、充实自我,并与数据爱好者共同分享、共同进步、共同成长!数据之路,前路漫漫,你我同在,互动前行!
展开
-
语音识别入门介绍
0 语音识别技术路线大致框图如上图所示,语音识别的大致过程可以分为以下几步:1、语音输入——这个过程可以通过电脑上的声卡来获取麦克风中输入的音频信号,或者直接读取电脑中已经存在的音频文件;2、音频信号特征提取——在得到音频信号之后,需要对音频信号进行预处理,然后对预处理之后的音频信号进程特征提取,MFCC是最常用的声学特征;3、声学模型处理——把语音的声学特征分类对应到音素或字词...原创 2019-07-12 17:44:09 · 2429 阅读 · 1 评论 -
Python3从零开始搭建一个语音对话机器人
从零开始搭建一个语音对话机器人目录01-初心缘由02-准备工作03-语音机器人的搭建思路04-语音生成音频文件05-音频文件转文字STT06-与图灵机器人对话07-文字转语音08-语音对话机器人的完整代码09-结束语10-有问必答01-初心缘由 最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其...原创 2019-07-19 17:00:20 · 49741 阅读 · 150 评论 -
自动语音识别ASR入门介绍
GMM + HMM应用场景,做输入法,输入一段话,变成文字,智能地往里面加标点符号。特征提取 最常用MFCC一帧frame信号,通常20-50ms(2-3个周期,人说话频率100Hz),一个音素之内。音素:音标的一个音,比如ei、si等MFCC维度越高,幅度越小,13维最好。孤立词识别对每一帧(有用信息:音色(包络))进行傅立叶变换 ➡️三角滤波得到filterbank ...原创 2019-07-24 19:28:37 · 5790 阅读 · 0 评论 -
语音识别技术的前世今生【前世篇】
目录1.背景2.孤立词识别2.1 特征提取2.2 动态弯算法2.3 GMM(Gaussian mixture model)2.4 HMM(Hidden markov model)2.5 EM训练算法2.6 语音识别基本方程3.连续语音识别3.1 语言模型3.2 大词汇量3.3 语音识别系统结构3.4 评价指标:WER4. 潘多拉魔盒4.1...原创 2019-07-22 16:04:42 · 5328 阅读 · 4 评论 -
语音识别技术的前世今生【今生篇】
目录1.前馈神经网络1.1Tandem结构1.2 Hybrid结构2.循环神经网络2.1 CTC2.2 Graphheme系统2.3 注意力机制3 语音识别之未来3.1 语音识别的现状3.2 语音识别的未来参考文献:1.前馈神经网络近几年深度学习的技术非常火,我们平时所说的深度学习主要是指深度神经网络,神经网络是一种监督学习的技术。神经网...原创 2019-07-22 18:50:08 · 1386 阅读 · 0 评论