粗糙集理解之二:属性约简

 
由上一节可以知道,粗糙集是处理模糊数据的有力工具,而要达到这样的目的需要有两个重要的步骤来进行处理—属性约简和值约简,属性约简是对粗糙集合(那些不能区分的集合)进行纵向的简化,把不必要的属性去掉,即去掉这些属性也不会影响对象的区分能力,这样便于以后进一步的简约处理
关于属性约简的一些基本概念
1. 由上节的可区分的概念引申出来:如果在整个信息系统 S (即带所有 P 的所有 U )上所有 Ui 都互不相等,那么就称为这个 S P 下是可分辨的,一般记作 ind(P)
解释:这个标号说明是在 P 这个条件集合下是可分辨的,而且另一个 P’ 下可能不可分辨,所以在对于一个 S 是否分辨取决于它的属性集合,因此 ind(P) 只需一个参数 P 即可
2. 如果去掉 P 中的某个属性集合 Pi ,系统 S 仍然是可以分辨的,那么 P 中的 Pi 是可以简约的,一般记作 ind P-Pi =ind P
3. 如果 P 中的任何一条属性都是不可简约的,那么就称 P 是独立的
解释: P 是独立的说明 P 中的任何一个属性都是必不可少的,它独立的表达一个系统分类的特征。文献 [3]
算法
属性约简的算法分析:
开发环境: myeclipse 数据库 mysql
函数说明:函数名attriSimpl() 无参数,返回属性简化后的数据
初始状态:所有数据已存入数据库(以下为模拟数据)
U
a
b
c
d
e
1
1
0
0
1
1
2
1
0
0
0
1
3
0
0
0
0
0
4
1
1
0
1
0
5
1
1
0
2
2
6
2
1
0
2
2
7
2
2
2
2
2
现在设e为决策属性,其他为条件属性,即对于不同的对象,不同的条件属性的组合会对决策属性有怎么样的影响?
算法思路:
基本假设是能影响属性e的只有a,b,c,d四个(即系统在a,b,c,d,e下可区分)
基本原则是如果所有的条件属性都是一样的两个对象其决策属性也应该是一样的(因为否则说明这个对象还有能影响其决策属性的条件属性未被列入表内)
那么如果去掉某个条件属性,对于任意两个不同的决策属性其他属性都不同,那么这个属性冗余,否则这个属性必需(即前面的概念2)
 
  • 10
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值