一、粗糙集概述
1.1 定义
粗糙集理论是一种刻画不完整性和不确定性(不确定因素和不完备信息)的数学工具,它能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,由波兰学者Z. Pawlak于1982年提出。
1.2 核心思想
粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来近似刻画。它无需提供问题所需处理的数据集合之外的任何先验信息,因此对问题的不确定性的描述或处理是比较客观的。
1.3 理论特点
- 无需先验信息:与其他处理不确定和不精确问题的理论相比,粗糙集理论不需要提供额外的先验信息。
- 互补性强:粗糙集理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。
- 知识约简:粗糙集理论支持在保持分类能力不变的前提下,通过知识约简来简化问题,导出决策或分类规则。
1.4 应用与发展
- 应用:粗糙集理论在人工智能、数据挖掘、决策支持系统等多个领域都有广泛的应用。它可以用来处理不完整、不一致的数据,发现数据中的隐藏模式和关联规则,为决策提供支持。
- 发展:尽管粗糙集理论已经取得了一定的成果,但它仍然处于继续发展之中。例如,关于不精确推理的粗糙逻辑方法、粗糙集理论与非标准分析和非参数化统计等之间的关系等问题仍有待进一步研究。此外,将粗糙集与其他软计算方法(如模糊集、人工神经网络、遗传算法等)相结合,设计出具有更高机器智商的混合智能系统也是一个值得努力的方向。
二、基本概念
给定一对 ,其中有限非空集合是称为论域(也称为宇宙),是上的等价。对称为近似空间。
等价关系将集合划分为若干不相交的子集。论域的这种划分形成了由导出的商集,用表示。 如果两个元素 , 在下无法区分,则我们说和属于同一等价类。包含的等价类记为。
近似空间由信息系统表征,其中是对象的有限非空集,称为论域。是一个非空的有限属性(特征)集。具体地,如果,则称为决策表。其中是条件属性的集合,是输出或决策结果的集合,有。,是属性的值域。是一个信息函数,对于每个,,。表示对象在属性上的值。
2.1 信息集
设是条件属性的子集。任何对象的关于的信息集可以表示为
关于的等价关系称为不可分辨关系,用表示,定义为
满足关系的两个对象,无法通过的属性来区分。
等价关系将划分为一些等价类,如下所示
其中表示由相对于确定的等价类,。 为简单起见,将替换为。
对于任何,关于的信息集表示为
例1:
表1是决策表,、 是条件属性,是决策属性。
令。 我们计算等价类。 我们有,其中
显然,关于的的信息集和的对象的信息集如下所示:
2.2 上下近似
设,是一个等价关系。。的上下近似值定义为
或者,等效地,
很明显,
近似空间中的边界区域定义为:
例2(例1续):
假设。我们可以计算关于的近似和边界区域。
得出:
2.3决策D的上下近似
给定一个决策表。称为决策类集合,意味着对象集合被决策属性划分为个互斥的清晰子集。给定任何子集,并且是由导出的等价关系,则可以将决策的上下近似定义为
相对于条件属性集的正区域,表示为
它是的所有元素的集合,可以通过唯一地分类到分区的块。
例3(例1、例2续):
是决策。 在这里,我们计算决策的上下近似和的正区域。
根据2.1节可以得出,
其中,,。
参考论文名称:A parallel method for computing rough set approximations