本文简单介绍了阿里云NLP技术平台中几个关键的点,如阿里目前正在做国际化,目前包含的语种从东南亚语种,西班牙语种,正扩展到欧洲语种。除此之外阿里NLP还在做行业级应用,包括在城市管理,医疗领域中已经推出了很多应用产品。
演讲嘉宾简介:
琳嫣,阿里云高级算法专家。博士毕业于德国萨尔大学,研究方向为词汇语义的歧义性,博士成果曾发表在Computational Linguistics期刊,以及ACL,EMNLP,NAACL,EACL,COLING等学术会议上。毕业后先后就职于微软奥斯陆,法国国立研究所LIMSI-CNRS,以及百度北京。入职阿里以来,主要做自然语言处理基础工作,包括分词、词性、实体、信息抽取以及知识库构建。同时也负责多语言处理基础的国际化工作。
以下内容根据演讲嘉宾视频分享以及PPT整理而成。
本次的分享主要围绕以下三个方面:
一、我们在干什么?
二、阿里云NLP技术平台
三、产品探索
一、我们在干什么?
人类语言非常丰富,NLP想做的就是在比较丰富的人类语言之中和机器语言做一个桥梁,让处理的信息成为机器能够理解的表示形式。这里介绍两个比较主流的流派,一个我们称作为统计表示,一个基于统计信息的表示方式。更传统一点的称为符号表示,更通俗讲就是早年做数据库时候有一些关键数据库,图谱信息,做的时候写一些推理,规则解释语言。统计表示就更black box一点,它有输入输出,那么中间具体是什么样的过程就比较难以控制。当然符号表示数据量比较大的时候会有一些问题,统计表示在大数据领域比较powerful一些。NLP应用有问答系统,对话系统,知识表示,推理,机器翻译。问答系统是目前比较火的技术,很多产品是基于这个技术研发的。在阿里做NLP更多是从业务场景出发解决问题