最新【独家沙龙内容整理】机器女友？—百度微软讯飞等顶级专家谈人机对话黑科技及未来 ——by中科院孢子创客空间

最新推荐文章于 2024-09-22 16:16:15 发布

squeue2019

最新推荐文章于 2024-09-22 16:16:15 发布

阅读量4.6k

点赞数 1

分类专栏：综述文章标签：机器学习微软百度讯飞沙龙

本文链接：https://blog.csdn.net/sunkun2013/article/details/49368479

版权

综述专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最新【独家沙龙内容整理】机器女友？—百度微软讯飞等顶级专家谈人机对话黑科技及未来

——by中科院孢子创客空间

1、写在前面

非常非常感谢【公众号：机器学习研究会】举办的这次沙龙。赞赞赞。以下内容皆来自于这次沙龙。

2、时间

2015年10月23日（周五）21：00

3、嘉宾

1）胡郁：科大讯飞高级副总裁、研究院院长

2）赵世奇：百度自然语言处理高级研究员，“小度” ，“度秘” 的核心技术负责人

3）李笛：微软亚洲工程院资深总监，微软“小冰” 项目负责人

4）李志飞：出门问问创始人，前谷歌研究院资深科学家，出门问问是安卓手表的缺省语音交互软件

5）黄伟：云知声创始人，前盛大创新研究院高管

4、主持人

雷鸣：北大大数据与机器学习创新中心主任；百度七剑客，酷我创始人

5、形式

实时互动，多群转发主群内容

6、主要内容

1）语音交互技术在语音识别、合成、问题理解、问题回答等相关领域的现状和挑战

2）未来5年，会有什么突破，使得这个技术能够大范围的使用？

3）基于语音的测试，能够突破图灵测试吗？图灵测试有意义吗？

4）智能客服在客服领域的应用，会替代真的客服吗？

5）智能情感聊天在沟通中的作用，会成为人们的聊天 “暖男” 和 “萨曼塔” 吗？

6）在教育领域会大有作为吗？

7）还能在其他什么领域会有很大空间？

7、全部内容

中科院孢子创客空间独家整理内容

雷鸣:
嘉宾：
1）胡郁：科大讯飞高级副总裁、研究院院长
2）赵世奇：百度自然语言处理高级研究员，“小度” ，“度秘” 的核心技术负责人
3）李笛：微软亚洲工程院资深总监，微软“小冰” 项目负责人
4）李志飞：出门问问创始人，前谷歌研究院资深科学家，出门问问是安卓手表的缺省语音交互软件
5）黄伟：云知声创始人，前盛大创新研究院高管

主持人雷鸣：北大大数据与机器学习创新中心主任；百度七剑客，酷我创始人

赵世奇:
大家好！

雷鸣:
由于胡郁和黄伟今晚坐飞机，在从机场回去路上，等他们到了会加入我们。
李笛:
；)

雷鸣:
欢迎几位嘉宾！！！

李志飞:
大家好，我是出门问问的CEO李志飞

雷鸣:

那我们先进行第一个话题。语音交互技术在语音识别、合成、问题理解、问题回答等相关领域的现状和挑战。请几位嘉宾从自己的角度给以阐释。

百度自然语言处理高级研究员“小度” “度秘” 的核心技术负责人赵世奇：

我先抛砖引玉，我认为问题理解和问题回答是这里面的主要难点。目前，各家系统还是对简单问题的理解和回答比较有把握，复杂问题和需要推理的问题就无能为力了。

出门问问创始人李志飞：

我从产品角度说一下：现状就是各大公司或创业公司都有了一定的技术积累，也有一些直接面向消费者的产品，但总体来说产品的黏性都比较不理想。挑战就是怎么找到能满足用户需求同时技术上也能实现的一种产品形态。

雷鸣:
志飞，世奇，我看问问和百度在解决订票，订餐等问题上都不错了，在通用的对话上，当前如何？
Live my best Iife!:
还是要把目前技术能实现的能力，和客户真实的需求结合在一起

赵世奇:
我觉得可能通用域、全自动的短期内还难以实现，但是垂直领域还是有些很有希望

Live my best Iife!:
对

雷鸣:
欢迎黄伟加入！

李笛:
微软在语音方面一直有很大投入，我们最近逐渐聚焦在“情感计算”的新方向上。过去TTS的目的是说清内容，比如相应的训练数据也都是从新闻稿这样的训练集来，现在我们在小冰上的目标不是说清内容，而是要有情感，这个目前有很大收获。

李志飞:
补充一下，现有技术在一些垂直领域而且用户有对的期望值时，其实是可以做到比较好的体验，比如说我自己用出门问问时体验是很好的。但一个小白用户用起来，由于对技术和产品没有正确地认识，体验会大打折扣。
Live my best Iife!:
正在酒店办入住

雷鸣:

黄伟，辛苦了，谢谢！

科大讯飞高级副总裁、研究院院长胡郁:

大家好，我的飞机刚刚落地。

百度自然语言处理高级研究员赵世奇:

跟着志飞的话题，现在的用户很多都是以尝鲜和测试为目的，并不是真的在使用

李笛:

同意，单纯说清内容的语音，不会有黏性。

雷鸣:

几位，如果现在系统在垂直领域还不错，那在那些领域做的比较好，在那些领域还比较差？举几个例子。

赵世奇:

所以他们总是在试探你这个产品和技术的边界

雷鸣:

欢迎胡郁！

雷鸣:

我们的嘉宾到齐了，非常感谢大家！！！

李志飞:

通用领域比较难，尤其是语义分析部分，因为语义分析是跟应用场景绑定的，比如说查飞机票信息和查餐馆做语义分析时需要考虑的问题很不一样。

赵世奇:

我觉得在哪些垂类做取决于两个因素，一是哪个垂类的技术可实现；二是哪个垂类真的需要多轮交互

赵世奇:

其实第二个问题想清楚了更不容易

李志飞:

语音识别倒是可以做到通用，但难点问题在别的地方：如噪音，口音，远场等等

李笛:

多轮交互可能就不是由语音部分来决定了。可以理解语音是感官，对话系统本身才是灵魂

雷鸣:

问一个问题，虽然说现在都用深度学习在做，但是我听说很多系统里面还是用了大量的模板匹配，你们怎么看？

李志飞:

合成理论上没有什么瓶颈，但问题是怎么说出来比较人性化

胡郁:

说到一些垂直领域，电话呼叫中心里面，也许是最先能够使用的。

百度自然语言处理高级研究员赵世奇:

尤其是如果能自动高效的学习模板，还是会很有帮助的，对于高频头部的问题，模板可以处理的比较不错。

出门问问创始人李志飞:

完全基于模板的系统可以在语义分析维度比较少，而且维度对应的潜在答案的entropy很低的情况下很有效

出门问问创始人李志飞:

如果维度比较多，每个维度的entropy很高的话，完全基于模板的系统基本不能用

科大讯飞高级副总裁胡郁：

统计规则的自然语言理解系统，还是现在来看比较靠谱的能够解决实际问题的系统。

雷鸣:
下面我们聊一下对未来5年的展望，你们觉得未来这5年技术和应用会有什么大的发展和突破？

微软亚洲工程院资深总监李笛：

同意李志飞。真实用户的对话常常是跨域的，维度小不了。模板根本兜不住，只能演示一下用。

出门问问创始人李志飞:：

同意世奇的说法，模板是可以从数据自动学习的，而且是加:我认为五年之内在技术上可能不会产生本质性、跨越性的发展，但如何用好大数据会是一个主要的突破口。其实深度学习的成功也是源于大数据。

雷鸣:
@赵世奇，是提升，但是难有实质突破，可以这么理解吗？

赵世奇:
我觉得我们对数据中埋藏的宝藏其实挖掘的远远不够

胡郁:
其实将来5年能够实现的技术在过去的5年里面，我们已经claim太多了。

李志飞:
其实典型的grammar induction在某种程度就是在自动学习模板（statistically）

李笛:

哈哈，对的。概念漫天飞

胡郁:

通常我们客易说的比较多，但是真正做起来比较慢。

李笛:

行业应该直接拿产品说话~

李志飞:

五年的展望：技术的突破不会突然发生，而是算法细节不断的提升和积累以及应用导向的深度细化

雷鸣:

@李志飞，会有量变到质变的可能吗

赵世奇:

我觉得这一轮人工智能热潮里面不冷静的因素很多，常常是不同的人站出来说已经在某些技术上突破了，但事后发现往往都是名不副实。

李志飞:

有可能，在这个过程中，真实用户的反馈非常重要

胡郁:

例如远场识别，现在的远场识别技术真的满足用户的需求了吗？我看还差得很远。

雷鸣:

同意，我看到了很多智能机器人，买来一看，就懂几个有限的指令。。。

胡郁:
量变引起质变是有条件的。
Live my best Iife!: 同意胡郁的观点

李志飞:
@李志飞，会有量变到质变的可能吗：有可能，除了技术细节本身的积累，在这个过程中，真实用户的反馈非常重要

胡郁:

如果本身的量变的方法，受到某些理论的限制，其实是有天花板的。

黄伟：

理论技术和能工业化落地之间还有很大距离

雷鸣:

谈谈图灵测试，大家怎么看这个测试，现在能够通过了吗？这个测试有意义吗？
赵世奇: 我觉得图灵测试的价值在于，如果我们非要有一个唯一的评估来整体性的评估一个智能系统的话，图灵测试看上去是最合适的。

李志飞:

图灵测试：理论上有意义，但对实际应用的指导意义不大

雷鸣:

小冰小度，他们算是通过图灵测试了吗

李笛:

还是有意义的。如果你把中间过程看成一个黑盒子的话，能实现图灵测试的方法就是通过大数据

李笛:

沈向洋在2015人工智能大会上说小冰通过了：）

赵世奇:

图灵测试是一个典型的end-to-end的测试，可以兼容各种具体方向的评估，但反过来说也不会针对特定的功能做出全面详尽的评估。

李笛:

我觉得图灵测试不是一个测试，是一个方法论，构建黑盒子的方法。测试本身已经不重要了

雷鸣:

我们顺势聊一下各种语音助手，家庭机器人，智能音响等，大家觉得，靠谱的“大白”，“萨曼塔”这样的机器智慧，还需要多久会来到我们生活中？其中的挑战又是什么？

李笛:

大白要成为现实，需要人工智能有个“基础服务层”。过去行业都在做Deep Chat，做各个垂直Domain，做Task Completion。我们自己的Cortana也走过这个弯路。

雷鸣:

其实现在Amazon的Echo，京东的叮咚，美国的Jibo，中国也有一大批的家庭机器人创业公司，看起来如火如荼，前景到底如何？

赵世奇:

我记得《Her》这部电影的时间预设在2025年，我觉得萨曼莎的功能性的部门（刨除了个人自主意识）的话，2025年有希望。

李笛:

但那些都是大白身上的那个卡。拔掉所有的卡，大白还有的那个部分，基本的IQ+EQ，情感交流的能力，那个是基础服务

李笛:

各个第三方可以把自己的Domain，插在小冰这样的基础服务上。

胡郁:

叮咚是玲珑公司的产品，讯飞与京东的合资公司，讯飞控股。

李志飞:

关于大白：个人不太喜欢把机器朝人的情感方向包装，觉得把机器人朝人的方向都是无意义的有害的炒作，只会设错用户的期待，然技术又达不到这种期待，最后只能失望收场

赵世奇:

我同意李迪说的，多个team并行的做各个垂类，最后技术既无积累，也不统一，进步会缓慢

雷鸣:

@胡郁，抱歉，核心技术实际是讯飞的。

黄伟:

我使用了，很不错，唤醒很灵

李笛：

我们在微信里，允许第三方公众号把小冰加到自己的公众号里。这样，第三方有小冰的基础服务，我们的搜索Index它的内容做触发。现在小冰应该是微信里最活跃的公众号TOP3。微软会专注做这个人工智能的基础服务层

雷鸣:

小冰这么火，主要是因为有“情感”吗？

黄伟:

@赵世奇不应该从各个垂直领域切入吗？还是一开始就做大而全的？

胡郁:

微软的小冰战略不错的，守正出奇

李笛:

情感是沟通的基本诉求。如果没有情感部分，机器人不如现在大家手机里的App来得方便。

胡郁:

好像也有“麒冰”的说法？

赵世奇:

的确应该从垂类切入，但是不应该是不同的team都从头开始做全新的垂类

黄伟:

这个我同意

李笛:

你点击按钮最方便，跟机器人对话来获取信息完成任务干什么呢：）那样多耗能

胡郁:

机器人还是具有外型上的带入感

李笛:

机器人比一个App多的，就是沟通能力。

雷鸣:

尤其是对孩子外形还是挺重要的

李志飞:

情感不一定要通过自然语言交互体现，比如说Jibo, 我觉得做的很好的是机械表情（就是身体转动和屏幕的显示相互配合做出很逼真可爱的表情）

胡郁:

人的情感很多来自于实体外形和动作

李笛:

外形部分，微软还不敢碰。我们的优势是软的部分。灵与肉，我们不大能搞定肉的部分：）

赵世奇:

关于外形，不过这里也有个问题，我们做的都不是工业机器人和一般意义上的服务机器人，所以因为外形带来的成本的价值有多大？

雷鸣:

外形的事情，我在考虑手机的历史，其实功能机时代，手机长得千奇百怪。但是到了智能机时代，反而真的都一样了。是不是智能的内核，比外形更加重要呢？

李志飞:

@赵世奇：从产品整体来说，意义还是很大的。现在很多机器人都是脖子上架一个pad，很难对用户产生吸引力

李笛:

我同意。对话系统是基本。

赵世奇:

“现在很多机器人都是脖子上架一个pad，很难对用户产生吸引力”
雷鸣:严重同意李志飞，我就非常讨厌PAD型机器人

赵世奇: ——是的，同意！

李笛:

实体机器人五年之内难有突破是真的

赵世奇:

所以萨曼莎完全没有实体，我觉得最近的科幻电影越来越务实了

雷鸣:

实体机器人，在运动平衡和成本上，确实很难快速普及。

雷鸣:

下面聊聊客服机器人吧，这个领域比较垂直，可以替代大量苦闷的客服妹妹。这个方向，在未来会发展很快嘛？

胡郁:

世奇，就萨曼莎那种想像还务实么？

李志飞:

对话系统肯定是整个自然语言人机交互的皇冠，但也是最难的。现在单轮式的自然语言搜索都还做的很差。如果引入对话会引入更多地复杂度，比如说对话状态的维护，用户知识模型，TTS和语音识别等带来的不确定性。所以出门问问的想法是先把单轮搜索做好，然后再去考虑对话。

雷鸣:

好像京东已经使用了，我不知道其他地方使用的如何。

赵世奇:

我认为客服机器人可以一定比例的承担客服任务，不能完全替代人类，但是会大大降低人力成本

雷鸣:

同意志飞，千里之行，始于足下。

李笛:

我们的看法是：客服机器人的重点是把客服这种成本中心，转化为利润中心

李志飞:

关于客服，同意世奇，机器不会完全取代人工，有可能的是半自动化系统（系统会自动路由问题，简单的机器解答，复杂的转专业人工甚至互联网用户众包）

雷鸣:

@李笛，如何转换为利润中心？

赵世奇:

@李迪，是说假如各种推荐引导吗？

胡郁:

把客服变成销售？

李笛:

是的。Intention分类

雷鸣:

@志飞，@世奇，你们觉得能够过滤掉多少？90%，99%？

李志飞:

@胡郁 @赵世奇很有商业头脑啊

赵世奇:

我觉得@李笛这个思路很有意思！

李笛:

把所有售后服务兜在机器人部分。把有机会产生销售的部分，迅速导到人工去。

雷鸣:

“我知道你不满意这个产品，但是另一款产品，一定能够让你满意。。。”

李笛:

我们在JD里的小冰就是这样的。欢迎大家尝试：）

胡郁:

二八原则在很多地方都是适用。

李志飞:

“你们觉得能够过滤掉多少？90%，99%？”：要看token还是type, token可以很高，type可能很低

赵世奇:

我比较保守，我觉得50%

胡郁:

另外，现在很多电话呼叫中心已经在改用，基于语音识别和自然语言理解的自动对话系统。以安徽移动为例，现在自动服务与人工服务的比例是1.3比1。

雷鸣:

50%啊，世奇还是挺保守的。

胡郁:

而且还在进一步加大。

雷鸣:

胡郁，用的你们的系统吗？

赵世奇:

当然不同领域的比例也是不一样的，问题的复杂度不同。

胡郁:

是的，暂时国内可能还没有其他的系统可用。

雷鸣:

@胡郁，系统的用户满意度如何？

胡郁:

我是说在电话客服这个领域。

黄伟:

呼叫中心很多问题是比较限定的，迭代一段时间，会收敛很多

胡郁:

系统的设计是这样的，如果用户不满意会直接转到人工客服。

李志飞:

关于把自然语言用在客服，不知道是否这些想找客服的用户都非常愤怒？

雷鸣:

机器回答，真人回答，用户能够分辨出来吗？满意度一样吗？

胡郁:

人还是分辨出来是机器回答还是真的回答。

雷鸣:

是否有过测试？

雷鸣:

分辨出来了，会不满意吗？

胡郁:

一看志飞就是过来人，当时肯定没少打客服mm的电话。

胡郁:

分辨出来也不会不满意啊，因为比按键强多了。

黄伟!:

我们现在很多打呼叫中心电话，其实需求并不复杂，但是按键菜单很麻烦，人工座椅又得排队

李笛:

这个难点在TTS了吧。heh

雷鸣:

是语音合成的问题，还是自然语言QA的问题？

李志飞:

哈哈，我在美国时，打进去机器问问题时我保持沉默不说话，直到机器放弃然后转入人工

黄伟:

自动客服肯定有需求

赵世奇:

嗯，坐席忙才是最不能接受的

胡郁:

你要是真正在美国打电话就知道了，坐席有的时候是非常忙，在中国现在还好，坐席还比较便宜，但是将来会越来越贵。

李笛:

自动客服在售后这部分最重要的是态度要好，能很大程度避免等待坐席的客户满意度下降。

赵世奇:

机器人的存在最大的价值就是缓解人力成本上涨的问题

李笛:

还是对话系统的事

李笛:

还是对话系统的事

雷鸣:

再聊聊教育，自然语音对话在教育上能够大有作为吗？

胡郁:

针对坐席的对话系统设计是，现在来看，最容易的。

雷鸣:

@胡郁，科大讯飞在研究高考机器大脑，最近进展如何？

李笛:

同意胡郁

胡郁:

其实在2000年到2010年之间，在语音识别技术没有突破之前，所有做语音识别的人都在做，基于语音识别的，语音评测。

胡郁:

从现在的结果来看，语音评测是可以用了，口语考试也过关了。

黄伟:

语音评测至少比老师客观，每个老师的尺度会有偏差，这一点，机器比人靠谱

赵世奇：

雷总说的教育具体是指哪个方面呢？辅助教学还是辅助评测还是教育相关的咨询？

雷鸣:

辅助教学方面呢？是否能有什么进展？

赵世奇:

辅助教学据我所知貌似还没有吧。。。

李笛:

应该是图像识别会更有机会

雷鸣:

现在在教育方面，除了语音评测外，还有其他和自然语言相关的应用比较有前景吗？

雷鸣:

拍照识别题目。。。

李笛:

小冰收到用户发来的图像里，有很多是题

赵世奇:

嗯，百度的图片搜索最大的一块就是拍照搜题，这是一个刚需

李笛:

我们认为这个对基础教育不利，所以不涉足，但是非学历教育领域，很好

赵世奇:

我觉得这个需求是客观存在的，看怎么引导

胡郁:

最近在语音评测和口语评测的基础上，讯飞又做了一个新的技术。

胡郁:

我们把它叫做全学科全面答题评测。这是对于离线手写的，答题卡上的所有内容包括选择题，填空题，论述题作文题。全部能由机器自动的进行，识别并进行评测。现在已经具备了在各种考试和，中高考中进行使用的，能力。

胡郁:

这样以后就可以对每一次的，甚至是小测验，进行快速的批改并形成大数据。

雷鸣:

@胡郁，基于拍照？

胡郁：

是的，现在还是基于，最简单的扫描仪的，将来基于拍照。

胡郁:

这样以后就可以对每一次的，甚至是小测验，进行快速的批改并形成大数据。

雷鸣:

@胡郁，基于拍照？

胡郁：

是的，现在还是基于，最简单的扫描仪的，将来基于拍照。

黄伟:

替代阅卷

雷鸣:

替代批改作业，节省不少老师时间啊

雷鸣:

最后，大家说一下，对于语音交互和自然语言对话方面，未来还有什么令人激动的应用？

黄伟：

对于手写体也可以吗

胡郁:

是针对离线手写体的。

赵世奇:

我认为但凡需要“复杂决策”的领域，这种基于多轮交互的智能系统都能派上用场。

雷鸣:

从时间上，这个作为最后一个议题吧，大家说完这个，说一下结束了。大家都结束了，我们开始问答环节。

李志飞:

关于语音交互的未来应用：我个人比较感兴趣的是把语音交互带入到一些新的交互设备产品里，比如说可穿戴，家用机器人，车载交互。这些新的交互设备用户的交互习惯还没形成，传统的键盘和触摸又不方便，所以是比较有机会让用户接受语音这种新的交互方式的

李笛：

我们的工作是推进人工智能真正普及。语音、图像和基础的对话系统。未来会是少数公司的平台。后端的Service/Content形成产业链。

雷鸣:

其他几位，对最后一个议题还有什么高论 @赵世奇，@黄伟，@胡郁

赵世奇:

我在上面说的，我认为但凡需要“复杂决策”的领域，这种基于多轮交互的智能系统都能派上用场，而且这才是真正需要多轮交互的地方

黄伟：

我觉得激动谈不上，语音和语义技术目前在我们的生活中真实落地的案例还不算太多，我们真正要做的一方面是培育用户的习惯，同时在技术和产品上服务好用户。这里需要解决的问题就很多了，比如方言，远讲等等。我们云知声会优先从落地去考虑。

雷鸣:

那我们结束对话阶段，进入问答阶段。

雷鸣:

请各个群开始提问，谢谢！

进入问答环节，欢迎各位提问~

Ninebot 王野:

@李笛小冰有兴趣和实体机器人企业合作吗？预装在实体机器人上，android系统。具有深度视觉，远场识别，八九个自由度的硬件关节，大概相当于晓龙820级别性能的CPU。可以和实体机器人的动作，以及机身上的灯光，姿态表情等联动吗？

李笛:

我们对实体机器人的要求比较高。不仅是实体，感官本身我们也下了很大的力气才放行。TTS做了很久，最近才发布出来。实体更加如此。

Ninebot 王野:

李笛:

我们对实体机器人的要求比较高。不仅是实体，感官本身我们也下了很大的力气才放行。TTS做了很久，最近才发布出来。实体更加如此。

李志飞:

如果思考能力是指机器能像人一样发明新的东西，这很难。但一些简单的不那么发散的推理还是可以的。

赵世奇:

“转发：人工智能会具备真正的思考能力吗”——我觉得这个问题要看如何定义“思考能力”，现在的很多功能也可以说它在“思考”，只是思考的机制不同。

雷鸣:

转发：知识模板是怎么作为深度学习模板的knowledge feature的？可否介绍相关更多细节或者paper?

李志飞：

“转发：知识模板是怎么作为深度学习模板的knowledge feature的？可否介绍相关更多细节或者paper?”：就是在统计模型里，可以把一些模板作为feature, 然后通过数据去自动学习这些feature的weight

黄伟：

转发：请问各位,语义语音这个领域适合小创业者进入吗? 我觉得适合，也有机会，但是路径很难

赵世奇:

“转发：请问各位,语义语音这个领域适合小创业者进入吗?”——关于这个问题，我觉得这个领域需要很深的技术积累、很长时间的投入，小创业者的确比较难。但小创业者可以专注在一个具体问题上做深，还是有机会。

李笛:

“转发：请问各位,语义语音这个领域适合小创业者进入吗?” 小创业者可以专注在一个Domain的Content和Service上做深，和微软这样的基础服务层合作。赵世奇:“转发：知识模板匹配问题当前是否有开源的方案？”——应该没有吧，只能具体问题具体分析

李志飞：

"转发：请问各位,语义语音这个领域适合小创业者进入吗? ": 如果现在再进去做语音语义这些特别基本的服务，可能比较难了，因为很难得到资本的支持。但如果是利用语音语义做一些深度的应用，应该还是很有机会的。

赵世奇：

“转发：要达到垂直领域的人工智能，比如说医疗或金融，是否第一步必须先解决自然语言搜索的问题和用户体验，即一次性对话（搜索）做好了，才有可能在多次对话或语境中有更加突破性的技术进步？”——单轮满足和多轮满足需要的技术不一样，所以不能这么说。

李笛：

“转发：要达到垂直领域的人工智能，比如说医疗或金融，是否第一步必须先解决自然语言搜索的问题和用户体验，即一次性对话（搜索）做好了，才有可能在多次对话或语境中有更加突破性的技术进步？”一般来说是的。不过医疗或金融倒是例外。这两个Domain本身很孤立，单独做也可以。

李志飞：

“转发：要达到垂直领域的人工智能，比如说医疗或金融，是否第一步必须先解决自然语言搜索的问题和用户体验，即一次性对话（搜索）做好了，才有可能在多次对话或语境中有更加突破性的技术进步？”：其实这个有两个部分，一部分是对后台数据的理解和挖掘，一部分是把这些挖掘出来的知识通过自然语言交互的方式去根人沟通。前者显然不需要人机交互，而且很有价值。

李笛：

“转发：各位老师好，我问一个问题，怎样才能够更好的理解用户的意图(语音或文字，其实本质相同)？” —— 必须要有“情感计算”模型。用户说：“你太坏了。”这句话怎么理解。

李志飞：

“转发：智能硬件，穿戴设备作为语音输入端，自身处理能力有限，必须配合手机在云端做智能识别，这样功耗问题比较严重，目前的穿戴设备在交互方面有什么新的突破？”：出门问问的Ticwear在智能手表上的语音交互比较复杂，比如说热词唤醒直接在手表上跑，有限词汇量（如通讯录）的语音识别在手机上离线跑，云端也有大词汇量的语音识别

赵世奇：

“转发：各位老师好，我问一个问题，怎样才能够更好的理解用户的意图(语音或文字，其实本质相同)？”——这个问题比较难回答，意图的识别分为好多的具体问题，比如需求分类、核心关键词的提取、纠错、语义的理解等等。所需要的技术很多。不过我觉得用好用户日志是关键。

李志飞：

“转发：各位老师好，我问一个问题，怎样才能够更好的理解用户的意图(语音或文字，其实本质相同)？”：上下文以及对知识的建模

李志飞：

“转发：老师您好，您说得“不那么发散的推理是能做的“请问用的是什么方法能介绍一下吗？”：这个有专门的logic inference的方法

赵世奇:

“转发：智能对话通过图灵测试应该需要很好的上下文理解，而不是简单的问答对匹配，请问如何解决上下文理解的问题？”——上下文理解核心是对上文的内容、主题做建模，并用这个模型来影响当前轮的需求理解和需求满足。当然还有一些比较细的工作，比如指代消解和省略补全。

李志飞:

“转发：各位老师好，知识图谱在垂直领域人工只能应用怎么样？”：在出门问问的语义分析里用到了大量的知识图谱（其实所谓的知识图谱就是一个结构化的数据库，如POI）

李笛：

“转发：智能对话通过图灵测试应该需要很好的上下文理解，而不是简单的问答对匹配，请问如何解决上下文理解的问题？” 这个只是解决方案的一半。应该是Session-oriented = Topic model + 上下文。如果有User Profile，可以跨Session