参考资料
源码请点:https://github.com/llSourcell/tensorf…
语音识别无处不在,siri,google,讯飞输入法,讯飞语记,智能家居,车,etc。
每天都在用的,很好奇它是怎么实现的,今天来看看这么便利的东东到底是什么样子呢。
进化史
最开始的 speech recognizer 只能识别 0-9 这几个数字,说别的单词是识别不了滴。
后来有一个叫做 DARPA 的梦想家 team 孜孜不倦地研究。

他们用 15000 个节点代表可能的发音,然后用暴力搜索 brute force search 算法来找到节点对应的文字。
后来 IBM 用 Hidden Markov Model 来预测每个点最大概率可能表示的文字。


再后来人们尝试用 NN 神经网络来做这个任务,但是很长时间没太大进展,直到 深度学习之父 Geoffrey Hinton 研究出个 Deep Learning 模型,语音识别的效果显著提高。

Yours ~~
</

本文介绍如何利用TensorFlow创建一个简单的语音识别器,从导入库、定义参数、加载数据到建立LSTM模型,以及训练和预测过程。通过这个项目,你可以了解语音识别的工作原理,并实践深度学习在语音识别中的应用。
最低0.47元/天 解锁文章
993

被折叠的 条评论
为什么被折叠?



