粗糙集

最新推荐文章于 2021-06-13 16:37:45 发布

byteyoung

最新推荐文章于 2021-06-13 16:37:45 发布

阅读量613

点赞数

分类专栏：数据挖掘

from byteyoung

本文链接：https://blog.csdn.net/qq_40126686/article/details/103837526

版权

数据挖掘专栏收录该内容

1 篇文章 0 订阅

订阅专栏

粗糙集理论是一种研究不精确，不确定性知识的数学工具。
粗糙集的思想为：一种类别对应一个概念（类别可以用集合表示，概念可以用规则描述），知识由概念组成；如果某个知识含有不精确概念，则该知识不精确。粗糙集对不精确概念的描述方法是通过下近似和上近似概念来描述。

上近似包含了所有使用知识R可确切分类到X的元素。

下近似包含了所有那些可能属于X的元素的最小集合。

病人头痛  胸口痛  体温   流感
a1   是是正常否
a2   是是高是
a3   是是很高是
a4   否是正常否
a5   否否高否
a6   否是很高是
a7   否否高是
a8   否是很高否信息的前提下进行数据化简 6，识别并评估数据之间依赖关系

在决策表中设置A={a1,a2,a3,a4,a5,a6,a7,a8},其中C={头痛，胸口痛，体温},D={流感}

那么，就可以设置C1=头痛，C2=胸口痛，C3=体温，所以

A/C1={{a1,a2,a3},{a4,a5,a6,a7,a8}} (头痛分类）

A/C2={{a1,a2,a3,a4,a6,a8},{a5,a7}} （胸口痛分类）

A/C3={{a1,a4},{a2,a5,a7},{a3,a6,a8}} (体温分类）

A/{C1,C2}={{a1,a2,a3},{a4,a6,a8},{a5,a7}}

A/{C1,C3}={{a1},{a2},{a3},{a4},{a5,a7},{a6,a8}}

A/{C2,C3}={{a1,a4},{a2},{a5,a7},{a3,a6,a8}}

A/C={{a1},{a2},{a3},{a4},{a5,a7},{a6,a8}}

A/D={{a1,a4,a5,a8},{a2,a3,a6,a7}}

Pos _c (D)={a1}U{a2}U{a3}U{a4}

//C在D中都存在的情况

K=y_c(D)=Pos_c(D)/U=4/8=0.5

Pos_(c-c1){D}={a1,a2,a4}!=Pos_c(D)

//C2,C3在D中都存在的情况

Pos_(c-c2){D}={a1,a2,a3,a4}=Pos_c(D)

//C1,C3在D中都存在的情况

Pos_(c-c3){D}=空集 !=Pos_c(D)

//C1,C2在D中都存在的情况

Pos_(c-{c1,c2}){D}={a1,a4}!=Pos_c(D)

//C3在D中都存在的情况

Pos_(c-{c2,c3}){D}=空集!=Pos_c(D)

//C1在D中都存在的情况

Pos_(c-{c1,c3}){D}=空集!=Pos_c(D)

//C2在D中都存在的情况

所以C2为冗余属性，即可删除的属性，所以C的D约简为C-{C2}={C1,C3}

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
粗糙集

粗糙集理论是一种研究不精确，不确定性知识的数学工具。粗糙集的思想为：一种类别对应一个概念（类别可以用集合表示，概念可以用规则描述），知识由概念组成；如果某个知识含有不精确概念，则该知识不精确。粗糙集对不精确概念的描述方法是通过下近似和上近似概念来描述。上近似包含了所有使用知识R可确切分类到X的元素。下近似包含了所有那些可能属于X的元素的最小集合。病人头痛胸口痛体温 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。