【无标题】

进击的reader

于 2022-06-08 15:33:07 发布

阅读量1.5k

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_48305176/article/details/125185013

版权

一、知识及其表示方法

人工智能的三大内容：知识表示、知识推理、知识应用

知识表示的重点部分：谓词表示法、产生式表示法、语义网络法、状态空间法描述问题

关于知识信息和数据

数据是信息的载体，本身没有确切含义，其构成关联性信息；信息是数据的关联，赋予数据特定的含义，仅可理解为描述性知识；知识是对信息的关联，也可以是对已有知识的再认识

知识表示

是对知识的一种描述，用一些约定的符号把知识编码成一组计算机可以接受的数据结构。
是研究用机器表示知识的可行性、有效性的一般方法，是一种数据结构与控制结构的统一体，既考虑知识的存储又考虑知识的使用
知识表示可看作是一组描述事物的约定，以把人类知识表示成机器能处理的数据结构

第一章重点内容

谓词逻辑法+状态空间法（野人渡河问题）+第一章PPT最后部分

1. 谓词逻辑法

谓词逻辑基于数理逻辑的知识

命题与真值

陈述句叫断言
具有真假意义的断言叫命题
命题的意义叫真值，真值有True和False两种情况

论域和谓词

论域：所讨论对象的全体
个体：论域中的元素
谓词：“张三是学生”，STUDENT (ZHANGSAN)，STUDENT是谓词，ZHANGSAN是个体

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mafSuMYt-1654673510512)(https://cdn.jsdelivr.net/gh/come-on-reader/PictureBed/BlogImg/202206081530775.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cZ3y1ceP-1654673510514)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606203915363.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yrPPwBp7-1654673510514)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606204652326.png)]

逻辑谓词的知识表示法

用逻辑谓词表示知识时，首先，需要根据所表示的知识定义谓词，然后，再用连接词或者量词把这些谓词连接起来，形成一个谓词公式（或者合式公式）。

eg：用谓词逻辑表示知识“每个人都有一个父亲”

第一步：定义谓词：person(x)，x是人；hasfather(x, y)，x有父亲y
第二步：知识用谓词公式表示如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QtlNG6BM-1654673510515)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606205505819.png)]

eg：用谓词逻辑表示知识“所有教师都有自己的学生”

第一步：定义谓词：

TEACHER(x)：表示x是教师；STUDENT(y)：表示y是学生；TEACHES(x,y)：表示x 是y的老师；

第二步：知识用谓词公式表示如下：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5O2eqwE1-1654673510515)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606205853524.png)]

2. 产生式表示法

事实的表示

确定性的事实用三元组，不确定性的事实用四元组，区别在于是否增加一个概率，三元组常用：

(对象,属性,值)：“雪的颜色是白色”可表示为：(snow, color, white)
(关系,对象1,对象2)：“王峰热爱祖国”可表示为：(love, wangfeng, country)

四元组常用：

(对象,属性,值,可信度因素) ：“这种动物是鸟的可能性为80%” 可表示为：(动物,类别,鸟,0.8)

产生式系统的基本结构

控制系统+规则库+综合数据库，其关系如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WaTnWCrz-1654673510516)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606210824442.png)]

一个用于动物识别的产生式系统

设该系统可以识别老虎，金钱豹，斑马，长颈鹿，企鹅，信天翁这6种动物。规则库包含如下15条规则：

R1：IF 该动物有毛发 THEN 该动物是哺乳动物

R2：IF 该动物有奶 THEN 该动物是哺乳动物

R3：IF 该动物有羽毛 THEN 该动物是鸟

R4：IF 该动物会飞 AND 会下蛋 THEN 该动物是鸟

R5：IF 该动物吃肉 THEN 该动物是肉食动物

R6：IF该动物有犬齿AND有爪AND眼盯前方THEN 该动物是肉食动物

R7：IF该动物是哺乳动物AND有蹄THEN该动物是有蹄类动物

R8：IF该动物是哺乳动物AND是嚼反动物THEN该动物是有蹄类动物

R9：IF该动物是哺乳动物AND是肉食动物AND是黄褐色AND身上有暗斑点THEN该动物是金钱豹

R10：IF该动物是哺乳动物AND是肉食动物AND是黄褐色AND身上有黑色纹，THEN该动物是虎

R11：IF该动物是有蹄类动物AND有长脖子AND有长腿AND身上有暗斑点THEN该动物是长颈鹿

R12：IF该动物是有蹄类动物AND身上有黑色条纹THEN该动物是斑马

R13：IF该动物是鸟AND有长脖子AND不会飞AND有黑白二色THEN该动物是鸵鸟

R14：IF该动物是鸟AND 会游泳AND不会飞AND有黑白二色THEN该动物是企鹅

R15：IF该动物是鸟AND善飞THEN 该动物是信天翁

现在假设推理开始前综合数据库中存放有如下事实：动物有暗斑，有长脖子，有长腿，有奶，有蹄。

推理机的工作过程如下：

先从规则库中取出来一条规则R1，检查其前提是否可与综合数据库中的已知事实相匹配，R1的前提是“有毛发”，但事实库中没有这一事实，故匹配失败，然后，取R2，该前提可与事实库中的已知事实“有奶”相匹配，R2被执行，并将其结论“该动物是哺乳动物”作为新的事实，加入到综合数据库中，此时，综合数据库的内容变为：
- 动物有暗斑，有长脖子，有长腿，有奶，有蹄，是哺乳动物
再从规则库中取R3，R4，R5，R6进行匹配，结果都匹配失败，接着取R7，该前提与事实库中的已知事实“是哺乳动物”相匹配，R7被执行，并将其结论“该动物是有蹄动物”作为新的事实加入到综合数据库中，此时，综合数据库的内容变为：
- 动物有暗斑，有长脖子，有长腿，有奶，有蹄，是哺乳动物，是有蹄类动物。
此后，R8，R9，R10均匹配失败，接着取R11，该前提“该动物是有蹄类动物AND有长脖子，AND有长腿AND身上有暗斑”与事实库中的已知事实相匹配，R11被执行，并推出“该动物是长颈鹿”。由于“长颈鹿”是目标集合中的一个结论，即已推出最终结果，故问题求解过程结束。

在匹配规则时，可能不止一条规则适用，那么产生式系统的控制策略分为两类，一类是不可撤回方式，一类是试探性方式

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GAECkbTx-1654673510516)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606212347137.png)]

3. 语义网络表示法

其实就是一个有向图，用节点代替概念，用节点间的连接弧代替概念之间的关系，语义网络又称联想网络。

语义基元：（结点1，弧，结点2）
基本网元：一个语义基元对应的有向图

语义网络可以表示事实性的知识，也可以表示有关事实性知识之间的复杂联系

（1）用语义网络表示事实

一般表示

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9xtDkJMu-1654673510517)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606214914551.png)]

表示稍复杂系统

eg：与会者有男，有女，有年老的，有年青的。其语义网络为：（其中，A,B,C,D分别代表四种不同情况的与会者）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V9wuCwb7-1654673510517)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215030530.png)]

表示某一情况，某一事件或者某个动作

eg：有如下事实：张山给肖红一本书(可把张山给肖红一本书作为一个事件，并在语义网络中增设一个“事件”节点)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rOfNaZ7O-1654673510518)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215353559.png)]

(2) 用语义网络表示有关事实间的关系

分类关系：指事物间的类属关系。如“是一种”等

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-f63BL4b1-1654673510519)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215452911.png)]

聚集关系：如果下层概念是其上层概念的一方面或者一个部分，则称它们是聚集关系。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-o1tlgrfN-1654673510520)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215626751.png)]
推论关系[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2qBS0Ugd-1654673510521)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215656740.png)]
时间、位置关系[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JgFqo0lB-1654673510523)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606215718828.png)]

(3) 用语义网络表示比较复杂的知识（多元语义网络的表示）

设有如下两个事实：1. 张三的自行车是飞鸽牌，黑色，28型；2. 李四的自行车是金狮牌，红色，26型。

解：如果写两个网络比较容易，但是对知识利用不方便，通过自行车这个通用概念把两个网络连接成一个。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ic7Tz3Fz-1654673510523)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220606220126811.png)]

4. 框架表示法

框架是一种描述对象属性的数据结构，在框架理论中，框架是知识表示的基本单位，框架由若干个“槽”结构组成，每个槽又分为很多“侧面”。

一个槽：用于描述所论对象某一方面的属性
一个侧面：用于描述相应属性的一个方面

槽和侧面所具有的属性值分别称为槽值和侧面值。

框架的一般表示形式：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cG7rz8pX-1654673510524)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607091146529.png)]

框架的BNF描述：

<框架> ::= <框架头><槽部分>[<约束部分>]

<框架头> ::=框架名<框架名的值>

<槽部分> ::= <槽>,[<槽>]

<约束部分> ::=约束<约束条件>,[<约束条件>]

<框架名的值> ::= <符号名>|<符号名>(<参数>,[<参数>])

<槽> ::= <槽名><槽值>|<侧面部分>

<槽名> ::= <系统预定义槽名>|<用户自定义槽名>

<槽值> ::= <静态描述>|<过程>|<谓词>|<框架名的值>|<空>

<侧面部分> ::= <侧面>,[<侧面>]

<侧面> ::= <侧面名><侧面值>

<侧面名> ::= <系统预定义侧面名>|<用户自定义侧面名>

<侧面值> ::=<静态描述>|<过程>|<谓词>|<框架名的值>|<空>

<静态描述> ::= <数值>|<字符串>|<布尔值>|<其它值>

<过程> ::= <动作>|<动作>,[<动作>]

<参数> ::= <符号名>

eg：用分层的框架网络表示

1976年3月18日，一次强度为里氏8.5级的地震发生在下斯洛文尼亚地区，造成25人死亡和5亿美元的损失。多年来靠近萨迪豪金斯断层的地区一直是一个地震多发区。

解：由于地震可看成是一种灾害事件,除地震以外,还有火灾,洪水,飓风等灾害事件,因此可以组成一个描述灾害事件的框架系统。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TcBItC9b-1654673510525)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607094508822.png)]

框架系统

框架网络：指具有横向联系或者纵向联系的一组框架。

横向联系：一个框架中的槽值或者侧面值可以是另一个框架的名字，通过一个框架可以找到另一个框架，这样就在两个框架间建立起横向联系。

纵向联系：由于属性的继承性，故可以把共同属性抽取出来，构成一个上层框架，然后再对专有属性分别构成一个下层框架，并在下层设立专用的槽（一般叫“继承”槽）。这样不仅在框架中建立了纵向联系，而且建立了下层框架的属性及值的继承关系，避免了重复描述，节约了实践和空间的开销。

框架系统可以用于描述：1.事物组成 2.层次分类网络

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-r2zMbTqB-1654673510526)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607095408197.png)]

框架中槽的设置与组织

框架描述了事物各方面的属性，也反映了事物间各种关系的数据结构，在框架中，“槽”起到了至关重要的作用，因此还起到了两方面作用：

描述事物各有关方面的属性
指出相关事物间的复杂关系

在框架作为知识的表示模式时，对槽的设置与组织要给与足够的重视！

框架表示知识的系统由两大部分构成：

（1）由框架及其相互关联构成的知识库

（2）由一组解释程序构成的框架推理机

5. 面向对象的表示法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hXazsO78-1654673510527)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607102044814.png)]

6. 脚本表示法

脚本是框架的一种特殊形式，由一组槽组成，用来描述特定范围内的一些事件的发生序列。

脚本结构：

进入条件：给出在脚本中所描述事件的前提条件
角色：在脚本所描述事件中可能出现的相关人物
道具：在脚本所描述事件中可能出现的相关物体
场景：用来描述事件发生的真实顺序。一个事件可以由多个场景组成，而每个场景又可以是其他的脚本
结果：脚本所描述事件发生以后产生的结果

（1）进入条件
①顾客饿了，需要进餐；
②顾客有足够的钱。
（2）角色
顾客，服务员，厨师，老板。
（3）道具
食品，桌子，菜单，钱。
（4）场景
场景1：进入
①顾客进入餐厅；
②寻找桌子；
③在桌子旁坐下。
场景2：点菜
①服务员给顾客某单；
②顾客点菜；
③顾客把菜单还给服务员；
④顾客等待服务员送菜。

场景3：等待

①服务员告诉厨师顾客所点的菜；

②厨师做菜，顾客等待。

场景4：吃

①厨师把做好的菜给服务员；

②服务员把菜送给顾客；

③顾客吃菜。

场景5：离开

①服务员拿来账单；

②顾客付钱给服务员；

③顾客离开餐厅。

（5）结果
①顾客吃了饭，不饿了；
②顾客花了钱；
③老板赚了钱；
④餐厅食品少了。

脚本所描述的事件是一个因果链，链头是一组开场条件，只有当这些初始条件满足时，该脚本中的事件才能开始，链尾是一组结果，只有当这组结果满足时，该脚本中的事件才能结束，以后的事件或者序列才能发生。

一个脚本建立之后，如果已知该脚本适合于所给定的事件，则对一些在脚本中没有明显提出的事件，可以通过脚本进行预测，对那些在脚本中已明显提到的事件，可通过脚本给出他们之间的联系。

7. 过程表示法

将有关某一问题的领域知识，连同如何使用这些知识的方法，均隐含地表示为一个求解问题的过程。过程表示事物的一些客观规律，表达的是如何求解问题，知识的描述形式是程序，所有信息均隐含在程序之中，知识库是一组程序的集合。

例：如果x与y是同班同学，且z是x的老师，则z也是y的老师。

过程规则：

BR（Teacher？z y）
GOAL（Classmate？x y）
GOAL（Teacher ？z x）
INSERT（Teacher z y）
RETURN

eg：设已知（Classmate 杨叶柳青），（Teacher 林海杨叶），找出两个人w及v，其中w是v的老师。

**解：**问题可表示为 GOAL（Teacher ？w v），求解过程是：

（1）在过程规则库中找出对于问题GOAL（Teacher ？w v），其激发条件可以满足的过程规则。

BR（Teacher ？z y）， w／z，v／y

（2）执行该过程规则中的第一个语句GOAL（Classmate？ x y）。此时，其中的y已被v代换。经与已知事实（Classmate 杨叶柳青）匹配，分别求得变量x及v的值：

x=杨叶 v=柳青

（3）执行该过程规则中的第二个语句GOAL（Teacher？ z x）。此时，x的值已经知道，z已被w代换。经与已知事实（Teacher 林海杨叶）匹配，求得了变量w的值：

w=林海

（4）执行该过程规则中的第三个语句INSERT（Teacher z y），此时，z与y的值均以知道，分别是林海和柳青，因此这时插入数据库的事实是：

（Teacher 林海柳青）

9. 状态空间法

状态空间法是以“状态空间”的形式来表示问题及其搜索过程的一种方法，是人工智能中基本的形式化方法，是讨论问题求解技术的基础。

状态：描述问题求解过程中不同时刻状况的数据结构。

一般是用一组变量的有序集合表示：

Q=(q0，q1，…，qn)，其中每个元素qi(i=0，l，2，…，n) 为状态变量。

当给每一个变量以确定的值时，就得到了一个具体的状态。

算符：引起状态中某些变量发生变化，从而使问题由一个状态变为另一个状态的操作。

算符可以分为走步、过程、规则、数学算子、运算符号、逻辑符号等

在产生式系统中，每一条产生式规则就是一个算符；而在下棋程序中，一个算符就是一个走步
状态空间：一个问题的全部状态及一切可用算符构成的集合。

状态空间由3部分构成：
- 问题的所有可能初始状态构成的集合S
- 算符集合F
- 目标状态集合G
用一个三元组表示： (S，F，G)

状态空间图：状态空间的图示形式。其中节点表示状态；有向边(弧)表示算符。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fTXCWebA-1654673510528)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607113847551.png)]

状态空间的问题求解就是从问题的初始状态集S出发，经过一系列的算符运算，到达目标状态

由初始状态到目标状态所用的算符的序列就构成了问题的一个解！

用状态空间表示问题的步骤

定义状态描述形式
用所定义的状态描述形式把问题的所有可能状态都表示出来，并确定问题的初始状态集合描述和目标状态集合描述。
定义一组算符，使得利用这组算符可把问题由一种状态转移至另一种状态！

利用状态空间求解问题的过程

首先将适用算符作用于初始状态，以产生新的状态
然后再把一些适用的算符作用于新的状态；这样继续下去，直到产生的状态为目标状态为止、
这时，就得到了问题的一个解，这个解是从初始状态到目标状态所用算符构成的序列

问题：①最优解问题；②搜索策略问题

例：二阶Hanoi塔问题

已知3个柱子l、2、3和两个盘子A、B(A比B小)
初始状态下，A、B依次放在1柱上；目标状态是A、B依次放在柱子3上
条件是每次可移动一个盘子，盘子上方是空顶方可移动，而且任何时候都不允许大盘在小盘之上

①定义问题状态的描述形式

设用Sk=(SkA，SkB)表示问题的状态，SkA表示盘子A所在的柱号，SkB表示盘子B所在的柱号。

②用状态描述形式把问题的所有可能的状态都表示出来。本问题共有九种可能状态:

S0=(1，1)， S1=(1，2)， S2=(1，3)

S3=(2，1)， S4=(2，2)， S5=(2，3)

S6=(3，1)， S7=(3，2)， S8=(3，3)

问题的初始状态集合为S={S0}，目标状态集合为G={S8}。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2I3FDqzx-1654673510528)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607115332096.png)]

③定义一组算符F

算符A(i，j)表示把盘子A从第i号柱子移到第j号柱子上的操作

算符B(i，j)表示把盘子B从第i号柱子移到第j号柱子上的操作

算符组F中共有12个算符：

A(1，2)，A(1，3)，A(2，1)，A(2，3)，A(3，1)，A(3，2)

B(1，2)，B(1，3)，B(2，1)，B(2，3)，B(3，1)，B(3，2)

问题的状态空间(S，F，G)构造完成

根据状态空间的9种可能状态和12种算符，构造它的状态空间图：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2CrJR76R-1654673510529)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607115553491.png)]

在状态空间图中，从初始节点(1，1)(状态S0)到目标节点(3，3)(状态S8)的任何一条通路都是问题的一个解。
最短的路径长度是3，它由3个算符组成：A(1，2)、B(1，3)、A(2，3)

10. 与/或树表示法

与/或树表示法是一种用于表示复杂问题及其求解过程的形式化方法，与/或树采用分解和变换的思想，将复杂问题转化为一系列本原问题，通过对这些本原问题的求解来实现对原问题的求解。

本原问题：是指那种不能或不需要再进行分解或变换，且可以直接解答的问题。
归约：把一个复杂问题分解或者变换为一组本愿问题的过程。

问题的分解与等价变换

问题的分解：是指把一个复杂问题分解为若干个子问题的过程。问题的解是所有子问题解的“与”，即只有当所有子问题都有解时，原问题才有解
问题的等价变换：是指对一个复杂问题进行同构或同态的等价变换的过程。即将原问题变换为若干个较容易求解的新问题，只要这些新问题中有一个有解，则原问题就有解。等价变换所得到的新问题的“或”与原问题等价。

问题归约的与／或树表示

与树：当把一个复杂问题分解为若干个子问题时，可用一个“与树”来表示这种分解。
或树：当把一个复杂问题变换为若干个与之等价的新问题时，可用一个“或树”来表示这种变换。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y2LtC2kG-1654673510536)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607131458640.png)]
与／或树：如果一个问题既需要通过分解，又需要通过变换才能得到其本原问题，则其求解过程可用一个“与／或树”来表示。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VP94NaJP-1654673510538)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607131651631.png)]
解树：解树是一个由可解节点构成，并且可由这些可解节点推出初始节点(原始问题)也为可解节点的子树。

用与／或树表示问题的步骤

①对所要求解的问题进行分解或等价变换。

②若所得的子问题不是本原问题，则继续分解或变换，直到分解或变换为本原问题。

③在分解或变换中，若是不等价的分解，则用“与树”表示，若是等价变换，则用“或树”表示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HhVHffOs-1654673510539)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607131923305.png)]

二、模糊信息处理

模糊逻辑 ——Fuzzy Logic

经典二值逻辑（布尔逻辑）
- 在经典布尔逻辑中，所有分类都有明确的边界（有突变）
- 任一被讨论的对象，要么属于这一类，要么不属于这一类
- 一个命题不是真就是假，不存在中间情况
模糊逻辑
- 对二值逻辑的补充，关键的概念是：渐变的隶属关系
- 一个集合可以有部分属于它的元素（渐变）
- 一个命题可能亦此亦彼，存在着部分真伪（不完全确定）
两种思维方式
- 精确的理性分析模式——与读、写、算相联系
- 模糊的直觉全盘模式——与模式识别和艺术能力有关。允许以不精确、不确定、非定量的自然语言，对复杂多变的事物或者现象进行思维

计算机不具备后一种模式能力，要使计算机进一步模拟人类思维的特点，可以引入模糊逻辑

模糊逻辑与人工智能：

人工智能主要研究如何使计算机完成原来由人才能做的具有智能性质的工作，即感知观察能力、记忆能力、逻辑思维能力和语言表达能力等一系列人的脑力活动中所能表现出来的能力。

传统的数字电子计算机以二值逻辑为基础，建立在加法和移位基础上的各种计算能力是它的特长。对确定性问题具有逻辑推理能力，有很高的速度、精度和效率。但是，没有创造性思维的能力。因此，不可能以二值逻辑来模拟人的复杂的思维进程。

1. 模糊集合及其表述

集合的概念：为了对事物进行识别，必须对事物按不同的要求进行分类。许多事物可以依据一定的标准进行分类。用于这种分类的数学工具就是集合论。解决精确性的集合问题可以用经典集合论，世界上大多数事物具有模糊性。为了描述具有模糊性的事物，引入模糊集合的概念。

经典集合：具有某种特性的所有元素的总和，可以适用列举法+定义法表示集合
模糊集合：在不同程度上具有某种特性的所有元素的总和

2. 模糊集合常用术语及其表述

①模糊集合和隶属函数

精确集合（非此即彼）：A={X | X > 6}

精确集合的隶属函数（特征函数）：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BayTmhoy-1654673510540)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607140728914.png)]

模糊集合：如果X是对象x的集合，则X的模糊集合 A：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kI9sFpEr-1654673510540)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607140837976.png)]

	  $\mu$<sub>A</sub>(*x*) 称为模糊集A的隶属函数

隶属函数的性质：

定义为有序对
隶属函数在0-1之间
其值的确定具有主观性和个人的偏好

X称为论域或者域，构造模糊集就是要：确定合适的论域和指定适当的隶属函数。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2GY9Fouh-1654673510541)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607224803949.png)]

论域的两种形式：

离散形式——序偶表示法
- X={上海北京天津西安}为城市的集合，模糊集合 C = “对城市的爱好”可以表示为：
  
  C = {(上海, 0.8), (北京, 0.9), (天津, 0.7), (西安, 0.6)}
- X = {0 1 2 3 4 5 6}为一个家庭可拥有自行车数目的集合，模糊集合 C = “合适的可拥有的自行车数目”，可以表示为：
  
  C= {(0,0.1),(1,0.3),(2,0.7),(3,1.0),(4,0.7),(5,0.3),(6,0.1)}
连续形式
- 令X = R+ 为人类年龄的集合，模糊集合 B = “年龄在50岁左右”，则B可表示为：
  
  B = {x, $\mu$ _B(x)|x $\in$ X }，式子中：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lTrYgB1q-1654673510541)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607225835603.png)]

模糊集合的公式表示法：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PjGLsnKr-1654673510542)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607230032351.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZkY2B0yN-1654673510542)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607230129039.png)]

②支集：支集(A) = {x| $\mu$ _A(x) >0}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y5SopoJP-1654673510542)(C:\Users\reader\Desktop\图片3.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I7OZmYgJ-1654673510543)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607231355309.png)]

⑨ 正态性：如果模糊集A的核非空，则A是正态。换句话说，总可以找到一个点x $\in$ X，使 $\mu$ _A(x) = 1。

⑩ 模糊数：模糊数A是实轴R上的一个模糊集合，并且满足正态性和凸性。

3. 模糊集合的运算和隶属函数的参数化

包含或者子集

其实就是B的隶属度一直在A的隶属度之上

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Dy3PYxyL-1654673510543)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232413038.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UMRbN8zz-1654673510544)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232425695.png)]

并/析取

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4ILqCVM6-1654673510544)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232512731.png)]
交/合取

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9SfvUFWn-1654673510545)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232521883.png)]
补/负

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mSxy0fEU-1654673510545)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232530157.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2OCm7wAc-1654673510546)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232615749.png)]

隶属函数参数化

三角形隶属函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OKzMc7fl-1654673510546)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232803345.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ByODPAAA-1654673510546)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232855258.png)]

参数a,b,c确定了三角形MF三个顶点的x坐标
梯形隶属函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lWgfkYx3-1654673510547)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232947621.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7srGhurW-1654673510547)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607232959043.png)]

参数a,b,c,d确定了梯形四个角的x坐标。当b=c时，梯形就退化为三角形。
高斯型隶属函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9907XC88-1654673510548)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607233059256.png)]

高斯MF完全由c和σ决定，c代表MF的中心；σ决定了MF的宽度。
钟形隶属函数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZsEP7RDW-1654673510548)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607233136118.png)]

参数完全由b通常为正；如果b<0,钟形将倒置。钟形MF实际上是概率中柯西分布的推广，因此又称为柯西MF。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zNDyvij2-1654673510548)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220607233214773.png)]

后半部分，66页PPT之后的部分，没有看懂

三、粗糙集理论及其应用

基本概念：有一个表示文献资料的对象集合U和U上的等价关系R， R是由对象的属性(这里是指标引词)集Ω派生的U集合的划分，R={X1 , X2 ,…,Xn }。我们称<U,R>为近似空间(Approximation space)。对于P $\subset$ R并且 P≠φ，这是指P是由Ω的子集派生的，那么∩P(所有P中等价关系的交集)也是一种等价关系，在Rough集中，我们常称∩P为P上的不可分辨关系 (Indiscernibility relation)，记作Ind§。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VSPdTYCF-1654673510549)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608094950778.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-raDKkmBb-1654673510549)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608095013366.png)]

粗糙集理论的特点：

不需要先验知识
强大的数据分析和约简能力：求最小的知识表达；识别数据之间的依赖关系
粗糙集侧重分类；模糊集侧重个体的含糊性

1. 粗糙集理论的发展概述

自然界大部分事物所呈现的信息都是不完整的、不确定的、模糊的和含糊的，经典逻辑无法准确、圆满的解决，粗糙集理论就是为了描述并处理“含糊“的信息。

2. 粗糙集理论的优点及局限性

优点：

除数据集之外，无需任何先验知识
对不确定性的描述与处理相对客观

Bayes理论，模糊集理论，证据理论等都需要先验知识，具有很大的主观性

局限性：

缺乏处理不精确或不确定原始数据的机制
对含糊概念的刻画过于简单
无法解决所有含糊的、模糊的不确定性问题
需要其他方法的补充

解决办法;

与模糊集理论相结合
与Dempster-Shafer证据理论相结合

3. 粗糙集理论在知识发现中的作用

在数据预处理时，粗糙集理论可以用于对遗失数据的填补；
在数据准备过程中，利用粗糙集理论的数据约简特性，对数据进行降维操作；
在数据挖掘阶段，可将粗糙集理论用于分类规则的发现。

4. 粗糙集理论的基本原理

知识：使用等价关系集R对离散表示的空间U进行划分，知识就是R对U划分的结果
知识库：等价关系集R中所有可能的关系对U的划分，表示为K = (U, R)
信息系统的形式化定义：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fYNF4ERP-1654673510549)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608101448566.png)]
一个关系型数据库可看作一个信息系统，其”列“为”属性“，”行“为”对象“。
基本集合/原子：U/R表示近似空间A上所有的基本集合（原子）
不可区分关系：
- U为论域，R是U×U上的等价关系，满足自反、对称、传递性质
- A={U，R}称为近似空间，R为不分明关系，或者不可区分关系，等价关系
- 若x，y $\in$ U，(x,y) $\in$ R，则x，y在A中是不分明的/不可区分的
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x6ZWlGFq-1654673510550)(https://cdn.jsdelivr.net/gh/come-on-reader/PictureBed/BlogImg/202206081529200.png)]

上下近似集

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YwMRQM65-1654673510550)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608110331230.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-l8mBWb9o-1654673510550)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608110347663.png)]

近似精度&分类质量

设S={U，Q，V，f}为一信息系统，且X $\subset$ U，P $\subseteq$ Q，则S上X的近似精度为：

设S为一信息系统，P $\subseteq$ Q，且令 $\psi$ = {X1, X2, X3, …., Xn}是U的一个分类（子集族），其中Xi $\subseteq$ U，则 $\psi$ 的上下近似分别为，其实就是将子集的上下近似合并：

分类 $\psi$ 的近似精度为：

由属性子集P $\subseteq$ Q确定的分类 $\psi$ 的分类质量为：

分类质量表示通过属性子集P正确分类的对象数与信息系统中所有对象数的比值。这是评价属性子集P的重要性的关键指标之一。

举个例子：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Q4tEkS2B-1654673510550)(C:\Users\reader\AppData\Roaming\Typora\typora-user-images\image-20220608111844958.png)]

解：原始属性集A = {c1, c2, c3, c4}的分类质量：

令R = {c2, c4}，重新计算分类质量，得：

5. 属性约简&核

属性约简：在一个信息系统S中，设 $\psi$ 是S上的一个分类，经过约简之后的最小属性子集具有同原始属性集相同的分类质量，即存在R $\subseteq$ P $\subseteq$ Q，使得 $\gamma$ _R( $\psi$ ) = $\gamma$ _P( $\psi$ )，称之为属性P的 $\psi$ 约简，记作REDU_$\psi$§。所有 $\psi$ 的交集称为 $\psi$ 核，即CORE_$\psi$§ = $\cap$ REDU_$\psi$§，核是信息系统中一系列最重要的属性。

在大多数情况下，分类是由几个甚至一个最重要的属性决定的，而不是由关系数据库中的所有属性的微小差异决定，属性约简和核的概念为提取系统中最重要的属性及其值提供了有力的数学工具，而且这种约简是不破坏原始数据集的分类质量的，也就是”完全“保真。

如何计算核？使用差别矩阵/可辨识矩阵。

其中，1≤ i ＜ j ≤ n

差别矩阵与信息系统的核有如下关系：对所有的c $\in$ C，c $\in$ CORE(C,D)的充要条件是，存在i，j（1≤ i ＜ j ≤ n），使得m_i,j = {c}。”含糊“是指分别属于两个不同类的对象具有完全相同的条件属性，在差别矩阵中，xi和xj是含糊的充要条件是存在i，j（1≤ i ＜ j ≤ n），使得m_i,j = {-1}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yvveAVrj-1654673510551)(https://cdn.jsdelivr.net/gh/come-on-reader/PictureBed/BlogImg/202206081530013.png)]

决策属性d = {接受，拒绝}，上表按照决策属性d可分为两个等价类：{x1, x4, x6, x7}和{x2, x3, x5, x8}。根据差别矩阵的计算公式可得：