参考资料
源码请点:https://github.com/llSourcell/tensorf…
语音识别无处不在,siri,google,讯飞输入法,讯飞语记,智能家居,车,etc。
每天都在用的,很好奇它是怎么实现的,今天来看看这么便利的东东到底是什么样子呢。
进化史
最开始的 speech recognizer 只能识别 0-9 这几个数字,说别的单词是识别不了滴。
后来有一个叫做 DARPA 的梦想家 team 孜孜不倦地研究。
他们用 15000 个节点代表可能的发音,然后用暴力搜索 brute force search 算法来找到节点对应的文字。
后来 IBM 用 Hidden Markov Model 来预测每个点最大概率可能表示的文字。
再后来人们尝试用 NN 神经网络来做这个任务,但是很长时间没太大进展,直到 深度学习之父 Geoffrey Hinton 研究出个 Deep Learning 模型,语音识别的效果显著提高。
Your