语音识别技术的最新进展

       711日,我在短文“现代人工智能走在仿生学的大道上”中提出关于现代人工智能的仿生学研究方向,是一句大实话。为什么?



大家知道,在上世纪60-70年代,加拿大神经生理学专家David Hubel(1926-2013)以实验为基础,搞清楚了人类大脑视觉系统对外界刺激信号的反应机制,揭示了大脑神经皮层的多层次结构,奠定了现代人工智能的仿生学基础。



在计算机科学发展历史中,语音识别(SR)是个难题,科学家绞尽脑汁,几乎什么方法都用了,还是不见成效。人的听觉神经系统是不是具有多层次结构特征?如果听觉系统的神经元对外界刺激信号的反应顺序有先后,那么,使用人工神经网络进行“仿真”是一条可行的道路。



废话少说。2011年秋季,在意大利佛罗伦萨召开的国际语音识别大会(Interspeech)上,微软发表了对语音识别深度神经网络建模的重大改进:协同发音(Coarticulation)建模,减低语音识别错误率,当场演示了”同声传译“,效果极佳。



2014年,微软推出了语音助手”小娜“(Cortana),并且将其捆绑到Win10操作系统之中。2015729日,中国广大计算机用户即可直接体验微软的语音识别新技术了。



至此,机器有了耳朵(ear)也有了眼睛(eye),人类不再孤独。实际上,机器什么”智慧“也没有,只是人类的一种驯服工具而已。



    注:2011年世界语音识别大会(InterSpeech),会议文集刊有近2,000篇论文,足见其规模之大,影响甚远。






袁萌712



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值