粗糙集理论

最新推荐文章于 2024-08-03 23:36:32 发布

翻滚de蛋炒饭

最新推荐文章于 2024-08-03 23:36:32 发布

阅读量1.8w

点赞数 23

分类专栏：粒计算和知识发现文章标签： RS 粗糙集 Pawlaw 近似空间上下近似

本文链接：https://blog.csdn.net/qq_36739040/article/details/100054924

版权

粒计算和知识发现专栏收录该内容

5 篇文章

订阅专栏

文章目录

写在前面
粗糙集

写在前面

形式化（formal）：在完备数学概念基础上，采用具有确定语义定义并有严格语法的语言表达的规范风格。
半形式化（semiformal）：采用具有确定语义定义并有严格语法的语言表达的规范风格。
非形式化（informal）：采用自然语言表达的规范风格。

粗糙集

1 . 粗糙集相关概念

又名：Rough Set、粗糙集、粗集。
提出：由Pwalak教授于1982年提出。
定义：RS是一种可以 定量分析 处理 不精确、 不一致、 不完整 信息与知识的 数学工具 。

目前相关国际会议：RSCTC、RSFDGrC和RSKT。

理论和应用基础：从近似空间导出的一对近似算子（上近似算子、下近似算子），又称上近似集合、下近似集合。

研究方法：构造化方法和公理化方法（代数方法、算子方法）

方法	含义
构造化	基本要素：论域上的二元关系、划分、覆盖、邻域系统、布尔代数定义粗糙近似算子导出粗糙集代数系统
公理化 /代数 /算子	满足某些公理的一元集合算子某些公理可以保证一些特殊类型的二元关系的存在

形式描述：集合、算子

与其他研究不确定和不精确理论区别：不需要提供问题所需要数据集合以外的任何先验信息（不需先验信息）。

主要研究方向：属性约简、规则获取、基于粗糙集的计算智能算法研究。

2 . 概念、可定义集

2.1 信息表

：一组对象的集合，对象由一组属性描述。如图1-1。信息表

图1-1

设M为信息表，则M的形式化描述为：
$M=(U,At,\{V_a|a\in At\},\{I_a|a\in At\})$
$U = \{x_1,x_2,...,x_n\}$ ：有限对象集合，又称：论域。
$At = \{头疼，肌肉疼，体温、流感\}$ ：有限非空的属性集合。
$V_a$ ：表示属性 $a\in At$ 的属性值范围，即属性 a 的值域。
$I_a:U\rightarrow V_a$ ：是一个信息函数； $I_a(x)$ 代表对象x在属性a的取值（属性值）。

2.2 决策逻辑语言 $\mathbb{L}$

To 更好的定义 概念 的内涵，采用 决策逻辑语言 来分析决策表。
决策逻辑语言：由原子公式组成。

公式
表示方式：	（属性，数据），比如：（头疼，是）
含义：	代表具有某些性质的子集；比如：（头疼，是）可以描述所有具有头疼属性和头疼属性值为是的所有对象。
m( p )	一个公式 `p` ,则 `m( p )` 代表具有`p`性质的对象全体。

概念的形式化描述：
信息表M中的概念：（ p , m( p ) ）
概念外延：m( p ) = 满足公式p的所有对象全体
概念内涵：p = 信息表M中对对象子集m(p)的描述

由于Rough Set中很多时候考虑的只是一个属性子集 $A\in At$ ,即在决策逻辑语言中只是考虑 $A$ 中的属性
$\mathbb{L}(A)$ ：表示由属性子集 A 定义的语言 $\mathbb{L}$

2.3 可定义集的形式化定义

定义一(子集可定义)：

在信息表M中，如果称对象子集 $X\subseteq U$ 是可被属性子集 $A\subseteq At$ 定义的，当且仅当在语言 $\mathbb{L}(A)$ 中存在一个公式 p 使得 $X = m (p)$ ，否则，X为不可定义的。

换句话说：只有当在语言 $\mathbb{L}(A)$ 中存在一个公式 p 使得对象子集 $X = m (p)$ 时候，子集 $X\subseteq U$ 是可被属性子集 $A\subseteq At$ 定义的。

可定义集的全体表示：
$Def(U,\mathbb{L}(A)) = \{ m( p ) | p \in \mathbb{L}(A)\}$

某种角度来讲概念的外延m(p)就是可定义集。
由 $\mathbb{L}(A)$ 定义的概念集合表示：
$DefCon(U,\mathbb{L}(A)) = \{ (p, m( p )) | p \in \mathbb{L}(A)\}$

2.4 等价关系E(A)| 不可分辨关系

等价关系： E(A)
等价类： $x]_{E(A)}$ ，由等价关系E(A)确定

对象 $x_i、x_j$ 在 $\mathbb{L}(A)$ 语言中有相同的 公式 p 描述（note： $x_i、x_j$ 有相同的属性值），那么两个对象 $x_i、x_j$ 是等价的。

$x_i、x_j$ 构成的可定义集合就是 属性集A上的等价关系E(A) 在 论域U上 产生的划分，记为 $\{ [ x ]_{E(A)} | x \in U\}$

example：

等价类： $U/E(A)= \{ \{x_1,x_2,x_3\}, \{x_4,x_5 \},\{x_6\}\}$
：由属性子集A划分了三个等价类。

3 . 近似空间、上下近似

3.1 近似空间

决策逻辑语言 $\mathbb{L}(A)$ 的 所有可定义集 正好可以构造成一个 $\sigma$ 代数 $\sigma(U/E(A))$ 。
$Def(U,\mathbb{L}(A)) = \sigma(U/E(A))$

$\sigma$ 代数，即 $\sigma(U/E(A))$ ：包含 $\emptyset$ 、等价关系E(A)构成的等价类和其并集。并且其交、并和补运算是封闭的。

$a p r = (U, E (A))$ ：称为一个Pawlaw近似空间，简称：近似空间。

封闭性：某一类数组成的集合记作A,有一种运算方式记作f, A中任意两个元素通过f得到的结果仍然在A中,那么f对于A是封闭的。

简单的说：近似空间 = 所有可定义集的集合 U $\empty$

3.2 上下近似

可定义集可以使用公式来进行精确的描述。那么不可定义集合呢？
使用可定义集上下界逼近的方式来描述。

定义二(近似算子)：

：设E(A)是信息表M上的等价关系，$X\subseteq U，上下近似算子 $\overline {apr}_{E(A)}$ , $\underline {apr}_{E(A)}$ 为：(后用简写： $\overline {apr}$ , $\underline {apr}$ )

上近似：
$\overline {apr}(X) = \cup\{ Y| Y\in \sigma(U/E(A)), Y\cap X \neq \empty \}$
$\cap\{ Y| Y\in Def(U,\mathbb{L}(A)), Y \subseteq X \}$

下近似：
$\underline {apr}(X) = \cup\{ Y| Y\in \sigma(U/E(A)),Y \subseteq X \}$
$\cup\{ Y| Y\in Def(U,\mathbb{L}(A)), Y \subseteq X \}$