​沃丰科技GaussMind知识表示学习,提高AI对客户意图的理解能力|举个栗子说AI

GaussMind 是沃丰科技的智能化产品线,主攻语音语义融合技术,自研领先的AI基础设施“原心引擎”(NLP-PaaS、ASR),打造了文本机器人、留资机器人、外呼机器人、呼入机器人、虚拟数字人、智能质检、智能会话分析、企业微信会话分析、智能坐席助手、智能拓客、企业搜索、智能KCS知识库、知识图谱等多款智能化应用产品,为企业提供营销、管理、服务全场景AI解决方案,全面助力企业实现智能化转型。

整合人类知识是人工智能(AI)的研究方向之一。受解决人类遇到的问题的启发,知识表示和推理是为智能系统表示知识而取得解决复杂任务的能力。近年来,知识图谱作为结构化人类知识的一种形式已经引起了学术界和工业界的极大关注。知识图谱是事实的结构化表示,由实体、关系和属性组成。实体可以是现实世界中的对象和抽象概念,关系表示实体之间的关系,实体的语义描述及其关系包含具有明确定义含义的类型和属性。

对于知识图谱的整体分类,通常分为知识表示学习、知识获取和知识应用三个大类。知识表示学习,是对知识图谱中的实体、关系和属性学习其向量表现形式,对于知识获取和下游应用具有很重要的作用。本文主要探讨GaussMind知识图谱在知识表示学习上的一些探索和在客服领域的应用效果。

知识表示学习概览

知识表示学习包括学习的表示空间、打分函数、编码模型和辅助信息等。

1.表示空间:包括Point-wise欧式空间、复数向量空间、高斯分布空间、流行和群空间。其中最常用的,是Point-wise欧式空间:将知识图谱中的实体和关系嵌入为向量或者矩阵空间,方法包括基于翻译的方法TransE、TransR、TransH,也有基于语义匹配的方法NTN、HoIE、AnaLogy等。

2.打分函数:用来衡量一个三元组(h, r, t)成立的可靠程度,有时也被称为能量函数,是基于能量的学习框架的基础。其中h表示三元组的头实体,t表示三元组的尾实体,r表示h到t之间的关系。基于能量学习的目标是保证正样本的打分高于负样本的打分(在TransE中,是负样本打分高于正样本打分)。打分函数通常分为两种情况:基于距离的打分函数和基于语义匹配的打分函数。

a)基于距离的打分函数通过衡量两个实体之间的距离的可靠程度,这里是使用关系作为加性的平移操作,类似于TransE定义的h + r = t,如下图所示:
图片
其打分函数为:
图片
也就是头实体的向量表示h,加上关系的表示r,减去尾实体的表示t,通过最终值的一阶或二阶范数,来衡量一个三元组是否存在。

b)基于语义匹配的打分函数通过头实体向量和关系矩阵的乘性计算,使得头实体与关系组合后转移到尾实体附近h Mr = t,如下图所示:
图片
其打分函数为:
图片
即通过头实体和尾实体之间的矩阵运算来判断三元组是否存在。

3.编码模型:通过特定的模型结构能够对实体和关系之间的交互进行编码,即一个实体和关系通过何种交互操作,能变为另外一个实体,包括线性/双线性模型、张量分解模型和神经网络模型等。以最常用的采用L2范数的TransE模型为例,将打分函数展开:
图片
可以看到转换形式是线性转换。

4.辅助信息:为了进一步提高表示学习的性能,结合一些外部辅助信息可以实现多模态嵌入,包括文本描述、类型约束、关系路径、视觉信息、逻辑规则等和知识图谱本身进行结合。

知识表示学习可概要分为上述四类,每个类别下都包含了大量的学术研究和业界探索,尤其是为解决知识图谱中的复杂关系表示(1对N,N对1,N对N的关系类型)提出的大量打分函数和编码模型,在此就不一一展开。

GaussMind在知识表示上的探索

知识图谱在企业服务中有着广泛的应用,例如:在制造业中的故障诊断、设备咨询;在法律行业中的合同审核、文本比对;在医药行业中的药品咨询等。GaussMind知识图谱作为中台服务,提供了帮助客户从0到1构建知识图谱的能力,其中在知识表示方面,为解决仅利用三元结构信息进行表示学习带来的数据稀疏问题,GaussMind有效利用知识库中的其他信息,以及库外的数据信息,提高了对客户问句的理解能力。

在做法上,GaussMind将所有的三元组“属性-属性值”或“关系-实体表述”的字符串都当作该实体的文本描述,作为辅助信息。然后将该辅助信息和关系编码模型进行联合表示学习,最终得到知识的向量表示。具体步骤如下:

1.实体描述模型:距离公式采用两个单词之间的欧氏距离,文本Embedding是用客服对话日志基于word2vector训练得到。其损失为:
图片
2.知识嵌入模型:采用的TransE模型,即h+r-t的二阶范式作为损失函数:
图片
3.对齐模型:对上述的实体表示和知识嵌入模型的表示,进行对齐。利用文本描述对齐,确保实体和文本中的单词表述在同一个语义空间中:
图片
通过加入文本辅助信息训练得到的知识表示,我们得到了基于知识图谱的实体和词的向量表示,在面对企业服务场景的时候,能更有效理解客户的意图。我们整理客服语料,在物流环境下,包含有“物流”、“物流方式”等本体,“物流”本体下包含“寄快递”、“收快递”等意图实体,“物流方式”下包含“货运”、“空运”等实体。比如客户在问询“空运寄快递到天津需要多久”时,我们通过在描述中加入实体描述“物流-寄快递”和“物流方式-货运”,就能有效避免匹配出错或意图理解错误的情况,提高知识库的匹配准确率。
图片
以上,正是为了提高AI对客户意图的理解能力,沃丰科技GaussMind在知识表示学习领域的一些探索。我们将陆续为大家带来更多的知识图谱系列技术科普内容,简明解读知识表示学习、知识获取、知识应用等AI技术的最新进展及在企业中的落地场景应用。

沃丰科技创立于2014年7月,是国内领先的AI驱动的客户服务、CRM和客户体验解决方案提供商。依托人工智能、大数据、云计算等核心技术,沃丰科技旗下Udesk、GaussMind、ServiceGo、微丰、CusBridge等产品成功将全维度的智能系统应用到企业客户服务、营销、客户运营等各个场景,得到众多国有企业和世界500强客户的认可。沃丰科技研发团队超过200人,资深算法研究员主要来自于微软、百度、腾讯、360、中科院等,核心团队成员拥有超过8年的智能对话系统设计经验。沃丰科技坚持创新,以 AI 驱动服务,用技术提升客户体验,全面助力企业实现数字化转型。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值