通信为基,数学为媒,构建语音梦想

       2011年11月23日,周二,下午,Compass,MSRA

       台上的老师绘声绘色,妙语连珠,台下的同学全神贯注,凝神静听。或许你已经猜到了,MSRA-USTC Class 的Advance Research Lecture 第二季正在进行中。

      这次我们非常有幸请到了我的Mentor,Speech组的Leader Researcher 霍强老师给我们讲解语音领域的相关知识。霍老师是中科大82级6系的学长,郭沫若奖学金得主,这可是科大本科生的最高荣誉。霍老师曾在香港大学从事了九年的教学和科研工作,与2007年8月加入微软亚洲研究院,目前主要从事语音识别方面的研究。

       介绍完霍老师想必大家都迫切想了解讲座的内容了吧,列位稍安勿躁,听在下慢慢道来。

       本次讲座的题目是“ An Introduction of Theoretical Foundation of Modern Speech Recognition Technology and Beyond”,与童老师讲座带给大家的惊叹不同,霍老师的讲座带给大家的更多是思考。

         讲座一开始,霍老师就教育我们要边学边悟,方可打通自己的任督二脉,向一个合格研究人员的方向迈进。边学边悟恰恰是我所欠缺的,往往我只满足于做完老师交给的任务,而很少去想为什么是这样子,为什么可以这样做,这方面的问题霍老师也跟我谈过,让我感触很深。或许这就是研究员和码农的区别吧~ 接着霍老师就现代语音技术的理论基础进行了详细讲解。霍老师首先告诉我们,当前语音识别的整个系统是以通信的视角建立的,然后向我们介绍了ASR(Automatic Speech Recognition)的两个Paradigm,紧接着讲述了这两个Paradigm能够工作的条件及失效的情况,最后向我们指出了语音技术的一些可能方案和面临的挑战。

 

        在整个讲座过程中,霍老师一再向我们强调数学的重要性,并通过一些简单的比较向我们点明了工程师与数学家的区别。数学家的优雅与工程师的务实相映成趣,共同用自己的劳动推动着科技的进步。霍老师开玩笑似的对大家说:“我们对工程师要对数学家充满敬畏。”

         另一处给我留下很深印象的地方是霍老师讲到建模错误带来的后果时举的大象的例子,无论我们把大象的脚趾擦的多么亮,对问题的解决也无济于事,这不能不让我们思考,如何站在一个比较高的层面看待和考虑问题,而不是纠结于细枝末节。

         在计算机技术日新月异信息急剧爆炸的今天我们应该如何去做研究,霍老师给出了他的忠告:第一,要能Handle huge amount  of data,第二,make full use of compute tool。

         在讲座最后,霍老师告诉我们这么一句话 “Limitation is opportunity ”,是啊,现有理论的不完善,恰恰是我们新生代研究人员的机会。相信很多人在看到一些Excellent Idea 时,往往会觉得“这个我也能想到啊”,于是做捶胸顿足状,所以我们要做的就是把捶胸顿足的机会留给下一代研究员,哈哈。

 

        这次讲座不仅让我们对语音技术的理论基础有了基本的认识,更让我们去思考如何去完善自己如何成为一个合格的科研工作者,我想这也正是霍老师希望这次讲座达到的效果吧。再次感谢霍老师!期待下一次的精彩讲座~

 

转载于:https://www.cnblogs.com/ustc_msra_ase/archive/2010/11/28/1890574.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值