百度冯知凡：基于知识图谱的多模认知技术及智能应用

最新推荐文章于 2021-03-10 16:02:06 发布

「已注销」

最新推荐文章于 2021-03-10 16:02:06 发布

阅读量1.1k

点赞数

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/103441797

版权

不到现场，照样看最干货的学术报告！

嗨，大家好。这里是学术报告专栏，读芯术小编不定期挑选并亲自跑会，为大家奉献科技领域最优秀的学术报告，为同学们记录报告干货，并想方设法搞到一手的PPT和现场视频——足够干货，足够新鲜！话不多说，快快看过来，希望这些优秀的青年学者、专家杰青的学术报告，能让您在业余时间的知识阅读更有价值。

人工智能论坛如今浩如烟海，有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办，承办单位为中国科学院大学学生会，协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会，百度为支持单位，读芯术、PaperWeekly为合作自媒体。“AI未来说·青年学术论坛”第十一期“信息检索与知识图谱”专场已于2019年11月24日下午在中科院举行。百度冯知凡为大家带来报告《基于知识图谱的多模认知技术及智能应用》。

冯知凡全场报告视频

冯知凡，现任百度知识图谱部主任架构师。2011年至2013年任职于百度互联网数据研发部，曾负责百度网页搜索内容价值、视频及图片的场景化推荐。2013年至今，任职于百度知识图谱部，参与了百度知识图谱设计及构建的整体流程，具有丰富的知识图谱实践经验，并主要负责Query理解、知识融合、知识消歧、知识图谱文本理解、知识表示学习、知识图谱多模态认知等技术。

报告内容：知识图谱在人工智能应用中的重要价值日益突显。基于海量互联网资源，百度构建了超大规模的通用知识图谱，并在搜索、推荐、智能交互等多项产品中广泛应用。同时，随着文本、语音、视觉等智能技术的不断深入，知识图谱在复杂知识表示、多模语义理解技术与应用等方面都面临新的挑战与机遇。本报告将重点介绍百度基于知识图谱的多模语义理解技术及应用的最新进展。

基于知识图谱的多模认知技术及智能应用

冯知凡老师首先介绍了相关背景，如为何用知识图谱理解视频，从单模态文本，过度到视频多模态的历程。随着4G、5G等技术的发展，视频等多模态内容成为非常重要的信息媒介，而对于百度公司，有很多视频类的产品，比如说视频搜索、信息流推荐、好看视频等，如何理解这些数十亿视频，是支撑这些视频相关产品的关键技术。

知识图谱自2012年提出至今，发展迅速，如今已经成为人工智能领域的热门问题之一，吸引了来自学术界和工业界的广泛关注，在一系列实际应用中取得了较好的落地效果，产生了巨大的社会与经济效益。比如智能客服系统已经在很多行业大规模应用，大大降低了人工客服的巨大劳动力成本；网感的智能数据治理系统TML SmartData对企业内部生成数据和外部销售数据进行自动对齐，补全，统计，及时生成业务报表以供决策。智能化的升级和转型对整个传统行业产生的影响将是颠覆性的。前几年在深度学习的推动下，机器感知能力显著提升。但以深度学习为代表的统计学习严重依赖大样本，这些方法只能习得数据中的统计模式。然而，现实世界很多实际问题的解决单单依靠统计模式是不够的，还需要知识，特别是符号化的知识。人类的语言理解、司法判案、医疗诊断、投资决策等等很多领域都是显著依赖知识才能实现的。而知识图谱就是这种不可或缺的知识的重要表现形式之一。

而机器认知智能的发展过程本质上是人类脑力不断解放的过程。认知智能的第一个应用就是大数据的精准与精细分析。越来越多的行业或者企业积累了规模可观的大数据，但是很多时候这些数据非但没有创造价值，还成为了一笔负资产。这一现象的根本原因在于，当前的机器缺乏诸如知识图谱这样的背景知识，机器理解大数据的手段有限，限制了大数据的精准与精细分析，从而大大降低了大数据的潜在价值。网感的智能数据治理系统TML SmartData可以自动识别相似字段。认知智能的第二个非常重要的应用是智慧搜索。下一代智慧搜索对机器认知智能提出了需求。智慧搜索体现在很多方面。首先，体现在搜索意图的精准理解方面。比如现在的百度已经具备了智能搜索功能。其次，搜索的对象越来越复杂多元化。以前搜索的对象以文本为主，现在大家希望能搜索图片和声音，甚至还能搜代码，搜视频，搜设计素材等等，要求一切皆可搜索。第三、搜索的粒度也越来越多元化。现在的搜索不仅能做篇章级的搜索，还希望能做到段落级、语句级、词汇级的搜索。尤其是在传统知识管理领域，这个趋势已经非常明显。第三个应用是智能推荐。智能推荐表现在很多方面。有场景化推荐、任务型推荐、冷启动下的推荐等。冷启动阶段的推荐一直是传统基于统计行为的推荐方法，难以有效解决的问题。利用外部知识，特别是关于用户与物品的知识指引冷启动阶段的匹配与推荐，是有可能让系统尽快渡过这个阶段的。再如跨领域的推荐，实现这种跨领域推荐显然商业价值巨大，但却需要跨越巨大的语义鸿沟。

冯知凡老师认为如果能有效利用知识图谱这类背景知识，不同平台之间的这种语义鸿沟是有可能被跨越的。知识推荐将显著增强用户对于推荐内容的信任与接受程度。消费背后的内容与知识需求将成为推荐的重要考虑因素。所以未来的推荐趋势就是精准感知任务与场景，想用户之未想。基于知识的推荐，将逐步成为未来推荐技术的主流。认知智能还有一个应用是智能解释。这体现了人们的一个普遍诉求，那就是希望智能系统具备可解释性。可解释性决定了AI系统的决策结果能否被人类采信。可解释性成为了很多领域（金融、医疗、司法等）中阻碍AI系统落地应用的最后一公里。比如在金融领域的智能投资决策，即便AI决策的准确超过90%，但是如果系统不能给出作出决策的理由，投资经理或者用户恐怕也是十分犹豫的。智能系统的可解释性体现在很多具体任务中，包括解释过程、解释结果、解释关系、解释事实。事实上，可解释人工智能最近受到了越来越多的关注。在学术界，机器学习，特别是深度学习的黑盒特性，日益成为学习模型实际应用的主要障碍之一。智能系统的一个非常重要的表现方式就是自然人机交互。越自然简单的人机交互方式越依赖强大的机器智能水平。自然人机交互包括自然语言问答、对话、体感交互、表情交互等等。特别是自然语言交互的实现需要机器能够理解人类的自然语言。除此之外，认知智能还体现在机器的深层关系发现与推理能力方面。

以知识图谱为代表的这一波知识工程的一系列技术，在认知智能的实现中起到非常关键的作用。从2012年Google提出知识图谱直到今天，知识图谱技术发展迅速，知识图谱的内涵远远超越了其作为语义网络的狭义内涵。当下，在更多实际场合下，知识图谱是作为一种技术体系，指代大数据时代知识工程的一系列代表性技术进展的总和。知识图谱是一种大规模语义网络，与上世纪七八十年代的各类语义网络相比较，最显著的差异就是规模差异。推而广之，以知识图谱为代表的大数据时代的各种知识表示与传统的知识表示的根本差别首先体现在规模上。传统知识工程一系列知识表示都是一种典型的“小知识”。而到了大数据时代，受益于海量数据、强大计算能力以及群智计算，我们如今能够自动化构建、或者众包构建大规模、高质量知识库，形成所谓的“大知识”。所以知识图谱与传统知识表示在浅层次上的区别，就是大知识与小知识的差别，是在规模上的显而易见的差别。

随后冯知凡老师提到，知识图谱对于认知智能的另一个重要意义在于：知识图谱让可解释人工智能成为可能。“解释”这件事情一定是跟符号化知识图谱密切相关的。因为解释的对象是人，人只能理解符号，没办法理解数值，所以一定要利用符号知识开展可解释人工智能的研究。可解释性是不能回避符号知识的。我们目前的互联网推荐，只能给我们推荐结果，却无法解释为什么。可解释推荐将是未来推荐研究的重要领域，将是具有巨大商业价值

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
百度冯知凡：基于知识图谱的多模认知技术及智能应用

不到现场，照样看最干货的学术报告！嗨，大家好。这里是学术报告专栏，读芯术小编不定期挑选并亲自跑会，为大家奉献科技领域最优秀的学术报告，为同学们记录报告干货，并想方设法搞到一手的PPT和现...
复制链接

扫一扫