一些粗糙集的学习感悟

最新推荐文章于 2024-07-12 10:45:15 发布

Bayern-Xie

最新推荐文章于 2024-07-12 10:45:15 发布

阅读量283

点赞数 1

文章标签：算法

本文链接：https://blog.csdn.net/bayern_xie/article/details/121743360

版权

上述应该注意的是，假如X={x1,x2,x5}，那么虽然x1和x2是不可分辨关系，但其实X也是可以精确描述的，因为{x1,x2}放在一起可以用同一个属性去描述，x5可以单独描述。所以并不是说集合里有不可分辨关系就不能精确描述。但是下面的例子：X={x1,x2,x3,x5}就不行，因为和x3有不可分辨关系的x4并不在X中，所以是无法通过知识库里的交和并来精确描述这个X的。

这里应该注意，上述描述，是判断用条件属性能否描述给定的集合，而下述的概念是，能否用化简后的知识系统去精确描述决策属性的值，但本质的知识是一样的。

（能否用化简后的知识系统去精确描述决策属性的值的本质其实也是判断用条件属性能否描述给定的集合：比如稳定决策属性的集合就是X1={x1,x2,x5},不稳定的决策属性集合就是X2={x3,x4,x6,x7,x8}，然后用各种知识系统去判断能否精确描述这两个集合。）

整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。考虑一个数据库中的二维表如下：

元素颜色形状大小稳定性

x1 红三角大稳定

x2 红三角大稳定

x3 黑圆小不稳定

x4 黑圆小不稳定

x5 蓝方块大稳定

x6 红圆中不稳定

x7 蓝圆小不稳定

x8 蓝方块中不稳定

可以看出，这个表就是上面的那个例子的二维表格体现，而最后一列是我们的决策属性，也就是说评价什么样的积木稳定。这个表中的每一行表示了类似这样的信息：红色的大三角积木稳定，黑色的小圆形不稳定等等。我们可以把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8}，任意一个列表示一个属性构成了对论域的元素上的一个划分，在划分的每一个类中都具有相同的属性。而属性可以分成两大类，一类叫做条件属性：颜色、形状、大小都是，另一类叫做决策属性：最后一列的是否稳定？下面我们考虑，对于决策属性来说是否所有的条件属性都是有用的呢？考虑所有决策属性是“稳定”的集合{x1,x2,x5}，它在知识系统A/R中的上下近似都是{x1,x2,x5}本身，“不稳定”的集合{x3,x4,x6,x7,x8}，在知识系统A/R中的上下近似也都是{x3,x4,x6,x7,x8}它本身。说明该知识库能够对这个概念进行很好的描述。下面考虑是否所有的基本知识：颜色、形状、大小都是必要的？如果我们把这个集合在知识系统中去掉颜色这个基本知识，那么知识系统变成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及这些子集的并集。如果用这个新的知识系统表达“稳定”概念，那么得到的上下近似仍旧都是：{x1,x2,x5}，“不稳定”概念的上下近似也还是{x3,x4,x6,x7,x8}，由此看出去掉颜色属性我们表达稳定性的知识不会有变化，所以说颜色属性是多余的可以删除。如果再考虑是否能去掉大小属性呢？这个时候知识系统就变为：

A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。同样考虑“稳定”在知识系统A/R2中的上下近似分别为：{x1,x2,x5,x8}和{x1,x2}，已经和原来知识系统中的上下近似不一样了，同样考虑“不稳定”的近似表示也变化了，所以删除属性“大小”是对知识表示有影响的故而不能去掉。同样的讨论对于“形状”属性，“形状”属性是不能去掉的。A/(R-R2)={{x1,x2},x6,{x3,x4},x5,x7,x8}，通过求并可以得知“稳定”的下近似和上近似都是{x1,x2,x5}，“不稳定”的上下近似都是{x3,x4,x6,x7,x8}。最后我们得到化简后的知识库R2,R3，从而能得到下面的决策规则：大三角->稳定，大方块->稳定，小圆->不稳定，中圆->不稳定，中方块->不稳定，利用粗集的理论还可以对这些规则进一步化简得到：大->稳定，圆->不稳定，中方块->不稳定。这就是上面这个数据表所包含的真正有用的知识，而这些知识都是从数据库有粗糙集方法自动学习得到的。因此，粗糙集是数据库中论域的有效方法。

（但是上述部分有点问题，因为其实A/(R-R1-R2)=A/R3={{x1, x2, x5}, {x3,x4,x7},{x6, x8}}，{x1,x2,x5}和{x3,x4,x6,x7,x8}的上下近似也都是相同的。所以我怀疑是例子或者叙述给错了。）

Bayern-Xie

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
一些粗糙集的学习感悟

整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。考虑一个数据库中的二维表如下：元素颜色形状大小稳定性x1 红三角大稳定x2 红三角大稳定x3 黑圆小不稳定x4 黑圆小不稳定x5 蓝方块大稳定x6 红圆中不稳定x7 蓝圆小不稳定x8 蓝方块中不稳定可以看出，这个表就是上面的那个例子的二维表格体现，而最后一列是我们的决策属性，也就...
复制链接

扫一扫