在 CSDN 主办的第三届“AI 开发者大会(AI Procon)”主会上,作为阿里巴巴副总裁、达摩院语言实验室首席科学家、ACM 杰出科学家,司罗在题为《为商业搭建语言桥梁》的演讲中,介绍了 NLP 的技术发展及阿里在该领域的落地实践。
演讲者 | 司罗
整理 | 王金许
责编 | 唐小引
出品 | CSDN(ID:CSDNnews)
司罗把人工智能分为四个层面。在计算智能层面,近年来取得了一定成就,而在更高层面的感知、认知和创造智能上还在探索中。
感知智能是指找出自然界的实体,比如找到新闻、故事中的人名、机构名、地址等相关信息。认知智能是在这些实体间找到相应关系,并进行有效推理,比如在海量新闻、故事之中,找到某个事件发生、发展、高潮和结束的整个过程。而创造智能是更高的层面,比如是否可以由计算机做出内容自洽的长篇小说等相关内容。
他认为,要实现完整的人工智能,离不开自然语言处理技术完成相应的语义理解能力。
作为“人工智能皇冠上的明珠”,自然语言智能要实现的是人与计算机之间用语言进行有效通讯。它融合了计算机学、数学、统计学、心理学、语言学等学科于一体,涉及自然语言的分析、抽取、理解、转化和生成等多个课题。
7 月 3 日上午,在 CSDN 举办的第三届“AI 开发者大会(AI Procon)”主会上,作为阿里巴巴副总裁、达摩院语言实验室首席科学家、ACM 杰出科学家,司罗在题为《为商业搭建语言桥梁》的演讲中,介绍了 NLP 的技术发展及阿里在该领域的落地实践。
他总结了 NLP 技术近年的飞速发展有三大趋势:
第一,深度语言模型的发展,引领很多自然语言技术和应用都取得了非常快的进步;
第二,越来越多的传统公有云服务技术从通用功能走向更多定制化服务,提供更精准、准确的服务;
第三,自然语言商业化的途径,一定是与行业和场景紧密结合,只有这样,才能更大发挥自然语言技术的商业价值。
以下是司罗在大会上的演讲内容,由 CSDN(ID:CSDNnews)编辑:
阿里巴巴是一家技术驱动的公司。我们非常深刻的认识到,人工智能、机器智能、自然语言智能的重要性,所以我们大约三年前成立了达摩院语言实验室。首要的目标是构建阿里巴巴自然语言技术体系,能够支撑阿里经济体内部关于自然语言的技术和相关的应用。其次,我们的技术是开放的,希望能够开放出我们的技术赋能阿里巴巴的合作者,发展普惠的自然语言技术。第三,我们希望能够创新自然语言技术,和学术界、工业界的朋友们一起能够探索未来智能。
达摩院语言实验室成立三年来,进行了大量技术的深入研发,也参加了一些技术评测,在很多评测之中取得了比较好的结果。
比如在 2016 年,ACM CIKM Cup 个性化电商搜索的第一名,2017 年年初美国标准计量局信息抽取英文实体分类比赛第一名,2018 年,在著名的 SQuAD 机器阅读理解中,首次在精确阅读方面超越了人类的结果。2018 年,机器翻译评测(WMT)取得了 5 个语向自动评测的第一名,以及最近在深度语言模型方面取得的好成绩。
NLP 技术平台
我们的 NLP 技术是通过很多的平台来更加规模化的支持相关业务,这里我会介绍几个相关技术