昨天微软亚研院自然语言处理组的周明博士给我们做了报告

      周明博士的报告深入浅出,趣味盎然,告诉我们自然语言处理的很多“土招”,而且一个接一个,并且说“这个够土吧,还有更土的”,而且周明博士的东北话特别调侃,不知不觉时间就流逝了。我凭着记忆谈几点我印象深刻的。

      周明提出了NLP的四个层次

      (1)机器翻译(MT),自动对答系统,这些早期的人工智能科学家的梦想其主要思想是完全不需要人的参与,通过规则或者统计的方法差不多做到头了,周明给我们说了一些指标,某某达到了89%,某某达到了90%,好像有些是词性标注,有些是语法分析,这些差不多到了瓶颈,但都没有做得很好。

      (2)搜索引擎,社会化搜索,对联等等,这些需要导入用户的智慧,日志的分析对模型的建立产生了巨大的影响,因此这一层次的工作需要马上有用户使用,各种用户的意见,群体智慧来改进效果。

      以上两类如果搞科研再切进去搞的话,“那是苦活”,基本上被各种牛人研究得恨透了。

      (3)利用社会化网络来从事一些工作,提到了Social QA,提到了facebook的i like it的功能(上次人人网的人来做报告也提到了),提到了facebook将会利用社会化网络来优化搜索引擎,把搜索纳入其一个组件。这是一个很大的梦想。

     (4)空白,可能的改变人类社交的方式,新的互联网形态,新的沟通方式。

       以上两类是科研和投资的重点,希望我们做科研在这两个层次多用力。

 

      有趣的是周明问我们有没有想创业的,结果教师里没有一个人举手,老师说我们清华的人都很低调,说去北大作报告,有一半人举手有创业想法,看来不同学校的思想差距确实很大,清华的人低调的够可以了。

 

      最后我说说我的想法,信息很大程度上是那些人可以理解的,有价值的,能够有影响力的,因此自然语言的处理更多的是一种信息的自动加工,这种加工过程处理后可以让信息具有更好的存储性,表示性和可用性,周明提了微软做的engkoo的例子,she is a adj. lady.这个查询是想知道形容lady的形容词是什么,要做到这个功能可以简单的想一下是需要做语法结构的处理,对齐等很多工作,但是没有很好的信息处理是不可能支持这样的查询的。那么我们首先应该去了解应用,从信息的应用情况来反推需要去做什么,否则在智能没有人用,得不到改进的机会,只能是曲高和寡的东西。

我要啦免费统计

 

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 17
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值