2.知识表示与知识图谱笔记

2.2.2 谓词

命题

(2) 个体是变元(变量)
(3)个体是函数
(4)个体是谓词

2.2.3 谓词公式

  • 谓词公式:对谓词进行自由包含和组合连接词与量词所构成的公式
1.连接词(连词)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.量词的辖域

在这里插入图片描述

2.2.4 谓词公式的性质

1.谓词公式的解释
  • 谓词公式在个体域上的解释:个体域中的实体对谓词演算表达式的每个常量、变量、谓词和函数符号的指派
  • 对于每一个解释,谓词公式都能求出一个真值
2. 谓词公式的永真性、可满足性、不可满足性
  • 永真性:如果谓词公式P对非空个体域D上的任一解释都取得真值T,则称P在D 上是永真的;如果P在任何非空个体域上均是永真的,则称P永真。
  • 可满足性:对于谓词公式P,如果至少存在D上的一个解释,使公式P在此解释下的真值为T,则称公式P在D上是可满足的。谓词公式的可满足性也称为相容性。
  • 永假性:如果谓词公式P对非空个体域D上的任一解释都取真值F,则称P在D上是永假的;如果P在任何非空个体域上均是永假的,则称P永假。谓词公式的永假性又称不可满足性或不相容。
3.谓词公式的等价性

设P与Q是两个谓词公式,D是它们共同的个体域,若对D上的任何一个解释,P与Q都有相同的真值,则称公式P和Q在D上是等价的,若D是任意个体域,则称P和Q是等价的,记为P<=>Q

  • 德·摩根律
    在这里插入图片描述

  • 连接词化规律

  • 量词转换律

4. 谓词公式的永真蕴含

对于谓词公式P与Q,如果P->Q永真,则称公式P永真蕴含Q,且称Q为P的逻辑结论,称P为Q的前提,记为P=>Q

  • 假言推理:P,P->Q=>Q

  • 拒取式推理:非Q,P->Q=>非P

  • 假言三段论:P->Q,Q->R=>P->R

  • 谓词逻辑的其他推理规则
    P规则:直接利用推理中给出的前提,即前提引入
    T规则:由某一个或几个前提可以通过等价、蕴含得到其他命题公式,即推理规则
    CP规则:附加前提引入
    反证法:
    在这里插入图片描述

一阶谓词逻辑知识表示方法

谓词公式表示知识的步骤
  • 定义谓词及个体
  • 变元赋值
  • 用连接词连接各个谓词,形成谓词公式
一阶谓词逻辑表示法的特点:
  • 优点:自然性、精确性、严密性、容易实现
  • 局限性:不能表示不确定的知识、组合爆炸、效率低
  • 应用:
    (1)自动问答系统(Green等人研制的QA3系统)
    (2)机器人行动规划系统(Fikes等人研制的STRIPS系统)
    (3)机器博弈系统(Filman等人研制的FOL系统)
    (4)问题求解系统(Kowalski等设计的PS系统)

2.3 产生式表示法

2.3.1 产生式

  • “产生式”:1943年,美国数学家波斯特 美国数学家波斯特(E.Post)首先提出。
  • 1972年,纽厄尔和西蒙在研究人类的认知模型中开发了基于规则的产生式系统。
  • 产生式通常用于表示事实、规则以及它们的不确定性度量,适合于表示事实性知识和规则性知识。
1. 确定性规则的表示:
  • 基本形式:IF P THEN Q
    或:P->Q

  • 例如:
    r :IF 动物会飞 AND 会下蛋 THEN 该动物是鸟

2. 不确定规则的表示:
  • 基本形式:IF P THEN Q (置信度)
    或: P->Q (置信度)
  • 例如 IF 发烧 THEN 感冒 (0.6)
3. 确定性事实的表示:

三元组表示:(对象,属性,值)
或: (关系,对象1,对象2)

4. 不确定性事实的表示:

四元组表示:(对象,属性,值,置信度)
或: (关系,对象1,对象2,置信度)

产生式与谓词逻辑中蕴含式的区别:
  • 表示范围不一样:除逻辑蕴含外,产生式还包括各种操作、规则、变换、算子、函数等
  • 蕴含式只能表示精确的知识,而产生式不仅能表示精确的知识,还可以表示不精确的知识。蕴含式的匹配总要求是精确的。产生式匹配可以是精确的,也可以是不精确的,只要按某种算法求出的相似度落在预先指定的范围内就认为是可匹配的
产生式的形式描述及语义–巴克斯范式:
<产生式>::=<前提> ——><结论>
<前 提>::=<简单条件>|<复合条件>
<结 论>::=<事实>|<操作>
<复合条件>::=<简单条件>AND<简单条件>[AND<简单条件>…
|<简单条件>OR<简单条件>[OR<简单条件>…
<操 作>::=<操作名>[(<变元>,…)]
    符号含义:

        “::=” 表示“定义为”

        “|”    表示“或者是”

          "[]"     表示“可缺省”

2.3.2 产生式系统

  • 产生式系统的基本结构
    在这里插入图片描述
  • 规则库: 用于描述相应领域内知识的产生式集合。
  • 综合数据库(事实库、上下文、黑板等):一个用于存放问题求解过程中各种当前信息的数据结构。
  • 控制系统(推理机): 由一组程序组成负责整个产生式系统的运行,实现对问题的求解。

控制系统做以下几项工作:
(1) 从规则库中选择与综合数据库中的已知事实进行匹配
(2)匹配成功的规则可能不止一条,进行冲突消解
(3)执行某一规则时,如果其右部是一个或多个结论,则把这些结论加入到综合数据库中;如果其右部是一个或多个操作,则执行这些操作
(4)对于不确定性知识,在执行每一条规则时还要按一定的算法计算结论的不确定性
(5)检查综合数据库中是否包含了最终结论,决定是否停止系统的运行

2.3.3 产生式系统的例子——动物识别系统

冲突消解
  • 一个事实匹配了多个知识的时候,称这种情况为冲突,此时需要按一定的策略解决冲突,以便从中挑出一个知识用于当前的推理,这一解决冲突的过程称为冲突消解。
  • 解决冲突时所用的方法称为冲突消解策略。

2.3.4 产生式系统的特点:

1.优点:自然性、模块性、有效性、清晰性
2.缺点:效率不高、不能表达结构性知识
3.适合产生式表示的知识:

  • 领域知识间关系不密切,不存在结构关系
  • 经验性及不确定性知识,且相关领域中对这些知识没有严格、统一的理论
  • 领域问题的求解过程可被表示为一系列相对独立的操作,且每个操作可被表示为一条或多条产生式规则

2.4 框架表示法

1975年,美国明斯基提出了框架理论:人们对现实
世 中各种事物的 都是 种类似 框架的结 世界中各种事物的认识都是以一种类似于框架的结
构存储在记忆中的 构存储在记忆中的。。
框架表示法:一种结构化的知识表示方法,已在多
种系统中得到应用。
61

2.4.1 框架的一般结构

  • 框架(frame):一种描述所论对象(一个事物、事件或概念)属性的数据结构。
  • 一个框架由若干个被称为“槽”(slot)的结构组成, 个框架由若干个被称为槽 slot)的结构组成,每一个槽又可根据实际情况划分为若干个“侧面”(f d) faced)。 一个槽用于描述所论对象某一方面的属性。 个槽用 描 所 对象某 方面 属性
  • 一个侧面用于描述相应属性的一个方面。
  • 槽和侧面所具有的属性值分别被称为槽值和侧面值。
    在这里插入图片描述

2.4.2 用框架表示知识的例子

例1 教师框架
框架名:〈教师〉
姓名:单位(姓、名)
年龄:单位(岁) 年龄:单位(岁)
性别:范围(男、女)
缺省:男
职称:范围(教授,副教授,讲师,助教)
缺省:讲师
部门 单位(系 教研室) 部门:单位(系,教研室)
住址:〈住址框架〉
工资:〈工资框架〉 工资:〈工资框架〉
开始工作时间:单位(年、月)
截止时间:单位(年、月)
缺省:现在

当把具体的信息填入槽或侧面后,就得到了相应框架的一个事例框架。

框架名:〈教师-1〉
姓名:夏冰
年龄:36
性别:女
职称职称:副教授 副教授
部门:计算机系软件教研室
住址 〈 d 1〉 住址:〈adr-1〉
工资:〈sal-1〉
开始工作时间:1988,9
截止时间:1996,7
例3 教室框架
框架名:〈教室〉
墙数:
窗数:
门数:
座位数:
前墙 〈墙框架〉 前墙:〈墙框架〉
后墙:〈墙框架〉
左墙:〈墙框架〉 左墙:〈墙框架〉
右墙:〈墙框架〉
门:〈门框架〉
窗:〈窗框架〉
黑板:〈黑板框架〉
天花板 〈天花板框架〉
讲台:〈讲台框架〉
例4 将下列一则地震消息用框架表示:

“某年某月某日某地发生6.0级地震,若以膨胀注水孕震模式为标准,则三项地震前兆中的波速比为0.45,水氡含量为地形改变为 ” 0.43,地形改变为0.60。”
解:地震消息用框架如下图所示。

框架名:〈地震〉
地 点:某地
日 期:某年某月某日
震 级:6.0 震 级
波 速 比:0.45
水氡含量:0.43
地形改变:0.60

2.4.3 框架表示法的特点

(1) 结构性:便于表达结构性知识,能够将知识的内部结构关系及知识间的联系表示出来。
(2)继承性:框架网络中,下层框架可以继承上层框架的槽值,也可以进行补充和修改。
(3)自然性:框架表示法与人在观察事物时的思维活动是一致的。

2.5 知识图谱

知识图谱(Knowledge Graph)又称为科学知识图谱,由Google与2012年5月提出,目的是提高搜索引擎的能力,改善用户的搜索质量及搜索体验。随着人工智能技术的发展和应用,知识图谱逐渐成为关键技术之一,现已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。

在这里插入图片描述

2.5.4 知识图谱的架构

在这里插入图片描述

2.5.5 知识图谱的构建

自顶向下构建:指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中。
自底向上构建:指借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。

2.5.6 知识图谱的典型应用

我们在前文中已经接触到了知识图谱对搜索引擎的成功应用。知识图谱为搜索提供了丰富的结构化结果,体现了信息和知识的关联,可以通过搜索直接得到答案。

除了通用搜索引擎之外,在一些特定领域中,知识图谱也发挥着重要作用,例如同花顺公司的问财系统、文因互联的文因企业搜索等。

  1. 医疗领域

在医疗领域,为了降低发现新药的难度,Open Phacts联盟构建了一个发现平台,通过整合来自各种数据源的药理学数据,构建知识图谱,来支持药理学研究和药物发现。

IBM Waston通过构建医疗信息系统,以及一整套的问答和搜索框架,以肿瘤诊断为核心,成功应用于包括慢病、医疗影像、体外检测在内的九大医疗领域。

其第一步商业化运作是打造了一个肿瘤解决方案(Waston for Oncology),通过输入纪念斯隆·凯特琳癌症中心的数千份病例、1500万页医学文献,可以为不同的肿瘤病人提供个性化治疗方案,连同医学证据一起推荐给医生。

  1. 金融投资领域

在投资研究领域,成立于2010年的AlphaSense公司打造了一款新的金融知识引擎。

与传统的金融信息数据平台不同,这款知识引擎并不仅仅局限在金融数据的整合和信息平台的范围,而是通过构建知识图谱,加上自然语言处理和语义搜索引擎,让用户可以更方便地获取各种素材并加工再使用。

另外一款非常具有代表性的金融知识引擎是Kensho。它通过从各种数据源搜集信息,构建金融知识图谱,并关注事件和事件之间的依赖,以及对结果的关联和推理,从而可为用户提供自动化语义分析、根据特定行情判断走势等功能。

  1. 政府管理和安全领域

在政府管理和安全领域,一个具有代表性的案例是Palantir,因通过大规模知识图谱协助抓住了本·拉登而声名大噪。

其核心技术是整理、分析不同来源的结构化和非结构化数据,为相关人员提供决策支持。例如在军事情报分析系统中,将多源异构信息进行整合,如电子表格、电话、文档、传感器数据、动态视频等,可以对人员、装备、事件进行全方位实时的监控分析,使调度人员第一时间掌握战场态势,并做出预判。

除了协助抓住本·拉登,Palantir的另外一项赫赫有名的成就是协助追回了前纳斯达克主席麦道夫金融欺诈案的数十亿美金。

  1. 电商领域

在电商领域,阿里巴巴生态积聚了海量的商品和交易数据,它以商品、产品、品牌和条码为核心,构建了百亿级别的商品知识图谱,可以广泛应用于搜索、导购、平台治理、智能问答等业务,同时保持每天千万级别的恶意攻击拦截量,极大提升了消费者的购物体验。

  1. 聊天机器人领域

在聊天机器人领域,具有问答功能的产品,例如Siri、微软小冰、公子小白、琥珀·虚颜、天猫精灵、小米音箱,背后均有大规模知识图谱的支持。

例如在琥珀·虚颜中,除了有通用百科知识图谱——“七律”的支持,还有子领域,例如动漫知识图谱、美食知识图谱、星座知识图谱的支持。图1-13给出了公子小白在多类别知识图谱融合后的一个问答对话示例。

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值