粗糙集(Rough Sets)理论-基础知识

一、粗糙集概述

1.1 定义

粗糙集理论是一种刻画不完整性和不确定性(不确定因素和不完备信息)的数学工具,它能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,由波兰学者Z. Pawlak于1982年提出。

1.2 核心思想

粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来近似刻画。它无需提供问题所需处理的数据集合之外的任何先验信息,因此对问题的不确定性的描述或处理是比较客观的。

1.3 理论特点

  • 无需先验信息:与其他处理不确定和不精确问题的理论相比,粗糙集理论不需要提供额外的先验信息。
  • 互补性强:粗糙集理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。
  • 知识约简:粗糙集理论支持在保持分类能力不变的前提下,通过知识约简来简化问题,导出决策或分类规则。

1.4 应用与发展

  • 应用:粗糙集理论在人工智能、数据挖掘、决策支持系统等多个领域都有广泛的应用。它可以用来处理不完整、不一致的数据,发现数据中的隐藏模式和关联规则,为决策提供支持。
  • 发展:尽管粗糙集理论已经取得了一定的成果,但它仍然处于继续发展之中。例如,关于不精确推理的粗糙逻辑方法、粗糙集理论与非标准分析和非参数化统计等之间的关系等问题仍有待进一步研究。此外,将粗糙集与其他软计算方法(如模糊集、人工神经网络、遗传算法等)相结合,设计出具有更高机器智商的混合智能系统也是一个值得努力的方向。

二、基本概念

给定一对 K=(U,R),其中有限非空集合U是称为论域(也称为宇宙)R\subseteq U\times UU上的等价。对K=(U,R)称为近似空间

等价关系R将集合U划分为若干不相交的子集。论域的这种划分形成了由R导出的商集,用U/R表示。 如果两个元素 x,y \in U(x\neq y)R下无法区分,则我们说xy属于同一等价类。包含x的等价类记为[x]_R

近似空间K=(U,R)由信息系统S=(U,A,V,f)表征,其中U=\left \{ x_1,x_2,...,x_n \right \}是对象的有限非空集,称为论域。A =\left \{ a_1,a_2,...,a_m \right \}是一个非空的有限属性(特征)集。具体地,如果A=C\cup D,则S=(U,A,V,f)称为决策表。其中C条件属性的集合,D是输出或决策结果的集合,有C\cap D=\varnothingV=\bigcup _{a\in A}V_aV_a是属性a值域f:U\times A\rightarrow V是一个信息函数,对于每个x\in Ua\in Af(x,a)\in V_af(x_i,a_j)表示对象x_i在属性a_j上的值。

2.1 信息集

B =\left \{ b_1,b_2, ... ,b_l \right \}\subseteq C是条件属性的子集。任何对象x\in U的关于B的信息集可以表示为

关于B的等价关系称为不可分辨关系,用IND(B)表示,定义为

满足关系IND(B)的两个对象x,y无法通过B的属性来区分。

等价关系IND(B)U划分为一些等价类,如下所示

其中[x]_B表示由x相对于B确定的等价类,[x]_B=\left \{ y\in U|(x,y)\in IND(B) \right \}。 为简单起见,U/IND(B)将替换为U/B

对于任何E\in U/B,关于B的信息集表示为

例1

表1是决策表Sa_1a_2 是条件属性,D是决策属性。

B=\left \{ a_1,a_2 \right \}。 我们计算等价类。 我们有U/B =\left \{ E_1,E_2,E_3,E_4 \right \},其中

显然,关于BE_1的信息集和E_1的对象的信息集如下所示:

2.2 上下近似

X\subseteq UR是一个等价关系。U/R=\left \{ E_1,E_2,E_3,...E_t \right \}X的上下近似值定义为

或者,等效地,

很明显,

近似空间中X的边界区域定义为:

例2(例1续)

假设X =\left \{ x_2,x_3,x_4,x_8,x_{10},x_{12} \right \}。我们可以计算X关于B的近似和边界区域。

得出:

2.3决策D的上下近似

给定一个决策表S =(U,C\cup D,V,f)U/D =\left \{ D_1,D_2,...,D_r \right \}称为决策类集合,意味着对象集合U被决策属性D划分为r个互斥的清晰子集。给定任何子集B\subseteq C,并且IND(B)是由B导出的等价关系,则可以将决策D的上下近似定义为

D相对于条件属性集B的正区域,表示为

它是U的所有元素的集合,可以通过B唯一地分类到分区U/D的块。

例3(例1、例2续)

D是决策。 在这里,我们计算决策D的上下近似和D的正区域。

根据2.1节可以得出U/D =\left \{ D_1,D_2,D_3 \right \}

其中D_1 =\left \{ x_1,x_5,x_7 \right \}D_2 =\left \{ x_2,x_3,x_4,x_8,x_{10},x_{12} \right \}D_3 =\left \{ x_6,x_9,x_{11} \right \}

参考论文名称:A parallel method for computing rough set approximations

  • 6
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值