经典知识表示理论
- 逻辑
从简单到复杂分为:
- 命题逻辑:
具有最简单的语法,定义了具有真假值的原子命题,通过与、或、非、蕴含、当且仅当等将多个原子命题组合成复合命题,而推理过程则根据逻辑连接词的真值表进行推导 - 一阶谓词逻辑(一阶逻辑):
在命题逻辑基础上引入了全称量词和存在量词,使得一阶逻辑可以量化实体和概念 - 高阶逻辑:
量化谓词或集合
二阶量化集合
三阶量化集合的集合
谓词逻辑
- 优点
谓词逻辑是一种强大的知识表示语言,一阶谓词逻辑具有完备的逻辑推理算法。 - 缺点
但是难以表示过程性知识和不确定知识,当表示知识的属性、谓词和命题数量增大时,推理因为符号的组合爆炸问题,计算复杂度呈指数增长态势。比较耗时,工作效率低。
- 语义网络
通过语义关系连接的概念网络。语义单元的形式表示为:<节点1,关系,节点2>
语义网络的关系类型有:
- 实例关系(ISA):
具体与抽象,一个事物是另一个事物的一个实例,如“小王是一个人”。 - 分类关系(AKO):
一个事物是另一个事物的一种类型,如“篮球是一种球” - 成员关系:
个体与集体,一个事物是另一个事物的成员,如“小于是一个公务员” - 属性关系:
事物和其属性之间的关系,如人的身高 - 聚合关系:
组织或结构特征的部分与整体的关系,如“凳子是桌子的一部分” - 时间关系:
不同事件发生时间的先后次序关系,常用在前,在后 - 位置关系:
不同事物在位置方面的关系,在上,在下,在内 - 相近关系:
不同事物在形状、内容等方面相似,如狮子老虎食物链位置相近
多元关系转化为多个二元关系
- 框架
从认知学的角度,人类都是以一种类似于框架的结构存储在记忆中。在根据实际情况对框架进行填充,填充的部分叫做槽,框架以及槽的粒度则根据人类对事物的认知程度而定。 - 脚本
通过一系列的原子动作来表示事物的基本行为,按照时间顺序描述事物的发生,类似于电影剧本。
脚本表示的知识有确定的时间或因果顺序。用来描述一个动态的过程而非静态知识的表示方法。比如:
顾客去餐厅吃饭脚本:
走进餐厅
拿号等待
被叫号
去固定座位就坐
完整的脚本包括:
- 进入条件
事件所发生的先决条件,比如就餐,顾客饿了不在家中就餐 - 角色
描述事件中可能出现的人物。如顾客,厨师,服务员等 - 道具
相关物体,菜单等 - 舞台
发生的空间,如餐馆 - 场景
时间的序列
主体部分,并不是只有一种就餐的场景,枚举出来是庞大的工程,这是脚本的一个缺陷 - 结局
结果,进入后续脚本的先决条件,比如顾客不再饿了
语义网中的知识表示方法
1.语义表示方法
这里指万维网,有效的组织和检索信息,从而使计算机能够利用互联网丰富的资源完成智能化的应用任务。
2.语义网知识描述体系
- XML
可扩展标记语言 - RDF
资源描述框架
三元组也可以扩展为内容更丰富的六元组
主语、谓词、宾语、时间、地点、附加信息 - OWL
网络本体语言
知识图谱中的知识表示方法
1.表示框架
- 事物
客观世界中的实体或对象 - 概念
具有相似本体特征的一类事物 - 属性
事物或概念具有的特征和特性等 - 关系
概念与实体之间的关联方式 - 函数
事物或概念之间转化的形式表达 - 约束
某项断言成立的限制条件的形式化描述 - 规则
一句某项断言得到逻辑推理的因果关系知识的形式化表达 - 公理
永远为真的断言
知识图谱真正的魅力在于它的图结构,在知识图谱上运行搜索,随机游走,网络流等大规模图算法,使得知识图谱与图论、概率图擦出火花。 - 基于知识图谱的逻辑规则的挖掘
得益于知识图谱频繁子图的挖掘,促进了逻辑规则的自动生成和评价 - 基于大规模链接图谱的标签传播
对知识图谱中的实体按照普通角度分类,有利于发现关键的实体
知识图谱的数值化表示方法
1.符号的数值化表示
语义计算
特征工程
2.文本的数值化表示
词空间模型
得到词的分布表示
3.知识图谱的数值化表示
- 基于张量分解
- 基于能量函数