粗糙集简记

粗糙集理论是数据挖掘和知识发现中的一个重要概念,它涉及等价关系、信息函数和知识颗粒。知识约简旨在减少特征属性集而不影响分辨能力,包括一般约简和相对约简。相对约简关注在保持决策属性不变的情况下去除冗余特征。决策表的约简通过简化条件属性来保留其功能,使用分辨矩阵辅助进行属性选择。知识依赖度则刻画了不同知识集之间的关系强度。
摘要由CSDN通过智能技术生成

1、粗糙集基本概念

U:论域
R = C\cup D:属性集合(这被认为是知识,或者知识库)
V:属性值域:
f:从U x R 到V的信息函数f  

一个信息系统S可以表示为一个四元组S = \left \{ U, R, V, f \right \}。在不混淆的情况下,简记为S = \left \{ U, R \right \},也成为知识库。

等价关系(通常用来代替分类)是不可或缺的概念,根据等价关系可以划分论域中样本为等价类。而每个等价类被称为同一个对象。等价关系是建立在不可分辨概念之上的。

B\subseteq U为一个非空属性子集,如果x_i,x_j\in U\forall r\in B,均有f(x_i, r) = f(x_j, r)成立,那么,我们称 x_i 和 x_j 关于属性子集B不可分辨。B不可分辨关系,简记为Ind(B),是一种等价关系,可以将论域U中的元素分成若干等价类,每个等价类成为知识库的知识颗粒。全体等价类组成的集合记为 U / Ind(B),称之为基本集合。若集合X可以表示成某些基本集的并时,则称X是B精确集,否则称为B粗糙集。

粗糙集中的“粗糙”主要体现在边界域的存在,而边界又是由下、上近似来刻画的。对于任意X\subset U,X关于现有知识R的下、上近似分别定义为:
 X的确定域Pos(X) = \underline{R}(X),是指论域U中那些在现有知识R之下能够确定地归入集合X的元素的集合;
反之,否定域为Neg(X) = U - \overline{R}(X)
边界域是某种意义上论域的不确定域,即在现有知识R之下U中那些既不能肯定在X中,又不能肯定归入\overline{X} = U / X中的元素,记为Bnd_k(X) = \overline{R}(X) - \underline{R}(x)

样本子集X的不确定性程度可以用粗糙度\alpha_R(X)来来刻画,粗糙度的定义为:\alpha_R(X) = \frac{Card(\underline{R}(X))}{Card(\overline{R}(X))},其中Card表示集合的基数(集合中元素的个数)。显然,0\leq \alpha_R(X) \leq 1,如果 \alpha_R(X) = 1,则称集合X关于R是确定的;如果\alpha_R(X) < 1,则称集合X关于R是粗糙的,\alpha_R(X)可认为是在等价关系R下逼近集合X的精度。

与粗糙度类似,在给出了两个知识集(特征属性)的相对肯定域的概念Pos_P(Q)之后,我们也可以以一个量来刻画两个知识集的依赖度。
设K =(U ,R)为一个知识库,P,Q\subseteq R为两个知识集。令 k = r_P(Q) = Card (Pos _P(Q))/ Card (U),称为知识Q依赖于知识P的依赖度。特别,当k=1时称为完全依赖;0<k<1时称为部份依赖;k=0时称为Q完全独立于知识P。

2、知识约简

(1)一般约简:是不改变论域中对象的分辨能力的前提下对特征属性集的约简。

(2)相对约简:是不改变决策属性Q的前提下对特征属性集P的约简。考虑一个分类相对于另一个分类的关系,就导出了相对约简与相对核的概念。相对约简的概念是条件属性相对于决策属性的约简

(3)决策表约简的重要内容之一是简化决策表中的条件属性使得约简前后的决策表具有相同的功能。同样的决策可以通过基于更少量的条件,便于我们借助一些简单的手段就能获得同样要求的结果,这是事半功倍的好事。
分辨矩阵:将决策表中关于属性区分的信息浓缩进一个矩阵当中,可用于决策表的属性约简。


因此只要考虑上半或下半三角部分足矣。

 决策表:

Ind(C)的等价类称为条件类,Ind(D)的等价类称为决策类。

 参考总结:https://wenku.baidu.com/view/b9fb3e619b6648d7c1c74635.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值