三支决策与三支聚类

三支决策

主要思想: 将一个论域 划分为三个不相交的区域,并使用不同的策略进行处理。

f : U ⟶ { P O S , B N D , N E G } f:U\longrightarrow\{POS,BND,NEG\} f:U{POS,BND,NEG}

f: 可以看做一个函数或映射,一个对象通过 f 映射到 { P O S , B N D , N E G } \{POS,BND,NEG\} {POS,BND,NEG}三个区域。
U: 论域
D: 条件集合

自决策粗糙集脱胎而来。

1. 三支决策发展

  • 成本敏感连续三支决策(DTRS引入)
  • 顺序三支决策和多级增量统一模型
  • 阈值确定(GTRS引入)
  • 智能三支群排序
  • 模糊事件三支决策模型
  • 基于公差粗糙集的三支决策模型
  • 三支属性约简
  • 重叠、增量聚类

2. 对象和簇关系

  1. 对象属于簇
  2. 对象可能属于也可能不属于簇
  3. 对象不属于簇

2.1 怎么确定关系

现有的确定归属关系方法:
模糊聚类(模糊C-均值算法)、粗聚类(粗糙集+K-means)、区间聚类等等。
以上方法是基于对象可以属于多个聚类,一种软聚类方法。

软聚类:通过约束来放宽聚类的边界,从而解决重叠聚类、离群点和不确定对象的问题。(就是说一个对象可以属于多个聚类)

  • 由于模糊集不能精确表示聚类。
  • 引入粗聚类,将上下近似的概念引入,将粗糙集和K-means方法结合,不足以描述聚类。
  • 基于决策理论的区间聚类。
  • 姚一豫教授将贝叶斯风险引入粗糙集,提出了决策理论粗糙集模型,并提出三支决策。
  • 于洪教授提出三支聚类分析框架。

3. 三支聚类分析

两个基本问题:

  1. 如何表示聚类
  2. 如果获得聚类,即:如何开发聚类

3.1 符号含义

U = { x 1 , x 2 , . . . , x n , . . . , x N } , n ∈ { 1 , 2 , . . . , N } U=\{x_1,x_2,...,x_n,...,x_N\},n\in \{1,2,...,N\} U={x1,x2,...,xn,...,xN}n{1,2,...,N}
x n = { x n 1 , x n 2 , . . . , x n d , . . . , x n D } , d ∈ { 1 , 2 , . . . , D } x_n=\{x_n^1,x_n^2,...,x_n^d,...,x_n^D\},d\in \{1,2,...,D\} xn={xn1,xn2,...,xnd,...,xnD}d{1,2,...,D}
C = { C 1 , C 2 , . . . , C k , . . . , C K } , k ∈ { 1 , 2 , . . . , K } C=\{C^1,C^2,...,C^k,...,C^K\},k\in \{1,2,...,K\} C={C1,C2,...,Ck,...,CK}k{1,2,...,K}
C k = { x 1 k , . . . , x i k , . . . , x ∣ C k ∣ k } , k ∈ { 1 , 2 , . . . , K } C^k=\{x_1^k,...,x_i^k,...,x_{|C^k|}^k\},k\in \{1,2,...,K\} Ck={x1k,...,xik,...,xCkk}k{1,2,...,K}

U U U:论域
x n x_n xn:U中第n个对象
x n d x_n^d xnd:第 n 个对象的第 d 个属性值
C k C^k Ck:第 k 个聚类,聚类使用对象集合表示

硬聚类:一个对象只属于一个聚类
软聚类:一个对象可属于多个聚类

一个区域来表示聚类,不能显示出哪些对象可能属于聚类;而使用三个区域来表示一个聚类,可以体现出哪些 对象绝对属于聚类、绝对不属于聚类和可能或不可能属于聚类。

3.2 三支聚类表示

所以我们使用 一对集合 来表示聚类:
C = ( C o ( C ) , F r ( C ) ) C=(Co(C),Fr(C)) C=(Co(C)Fr(C))

C o ( C ) ⊆ U Co(C) \subseteq U Co(C)U F r ( C ) ⊆ U Fr(C) \subseteq U Fr(C)U
T r ( C ) = U − F r ( C ) − C o ( C ) Tr(C) = U - Fr(C) - Co(C) Tr(C)=UFr(C)Co(C)
C o ( C ) 、 F r ( C ) 、 T r ( C ) Co(C)、 Fr(C) 、Tr(C) Co(C)Fr(C)Tr(C) :分别代表核心区域(Core Region),边缘区域(Fringe Region)和 外部区域(Trivial Region)

x为一个对象:
x ∈ C o ( C ) 、 x ∈ F r ( C ) 、 x ∈ T r ( C ) x\in Co(C)、x\in Fr(C) 、x\in Tr(C) xCo(C)xFr(C)xTr(C) :分别代表 x一定属于C,x可能属于C、x不属于C

3.3 三支聚类区域关系

U = C o ( C ) ∪ F r ( C ) ∪ T r ( C ) U = Co(C) \cup Fr(C) \cup Tr(C) U=Co(C)Fr(C)Tr(C)
C o ( C ) ∩ F r ( C ) = ∅ Co(C) \cap Fr(C) = \empty Co(C)Fr(C)=
F r ( C ) ∩ T r ( C ) = ∅ Fr(C) \cap Tr(C) = \empty Fr(C)Tr(C)=
T r ( C ) ∩ C o ( C ) = ∅ Tr(C) \cap Co(C) = \empty Tr(C)Co(C)=

  • 代表着三个区域是互斥的、无交集的。

3.4 三支聚类定义方案

f o r ∀ k , C o ( C k ) ! = ∅ for \forall k ,Co(C^k) != \empty fork,Co(Ck)!=
⋃ k = 1 K ( C o ( C k ) ∪ F r ( C k ) ) = U , 1 &lt; k &lt; K \bigcup_{k=1}^K (Co(C^k) \cup Fr(C^k)) = U, 1 &lt;k&lt;K k=1K(Co(Ck)Fr(Ck))=U,1<k<K

  • 每个聚类的核心区域不为空
  • 所有聚类的核心区域+边缘区域的并集等于论域U,代表任何对象必须属于一个聚类

3.5 聚类簇的表示

三支聚类簇:
C = { ( C o ( C 1 ) , F r ( C 1 ) ) , ( C o ( C 2 ) , F r ( C 2 ) ) , . . . , ( C o ( C k ) , F r ( C k ) ) , . . . , ( C o ( C K ) , F r ( C K ) ) } C = \{(Co(C^1),Fr(C^1)),(Co(C^2),Fr(C^2)),...,(Co(C^k),Fr(C^k)),...,(Co(C^K),Fr(C^K))\} C={Co(C1),Fr(C1),Co(C2),Fr(C2),...,Co(Ck),Fr(Ck),...,Co(CK),Fr(CK)}
双支聚类簇:
C = { C o ( C 1 ) , C o ( C 2 ) , , . . . , C o ( C k ) , , . . . , C o ( C K ) } C = \{Co(C^1),Co(C^2),,...,Co(C^k),,...,Co(C^K)\} C={Co(C1),Co(C2),,...,Co(Ck),,...,Co(CK)}

3.6 三支软聚类条件

( 1 ) : C o ( C k ) ∩ C o ( C t ) ! = ∅ , o r (1) :Co(C^k) \cap Co(C^t) !=\empty,or (1):Co(Ck)Co(Ct)!=,or
( 2 ) : F r ( C k ) ∩ F r ( C t ) ! = ∅ , o r (2) :Fr(C^k) \cap Fr(C^t) !=\empty,or (2):Fr(Ck)Fr(Ct)!=,or
( 3 ) : C o ( C k ) ∩ F r ( C t ) ! = ∅ , o r (3) :Co(C^k) \cap Fr(C^t) !=\empty,or (3):Co(Ck)Fr(Ct)!=,or
( 4 ) : F r ( C k ) ∩ C o ( C t ) ! = ∅ (4) :Fr(C^k) \cap Co(C^t) !=\empty (4):Fr(Ck)Co(Ct)!=

k != t
满足以上条件的聚类簇,是软聚类簇,否则是硬聚类簇

在这里插入图片描述

4. 基于评价的三支聚类模型

使用评估函数和评估函数值的一对阈值生成三个区域。

假设有一对阈值 ( α , β ) (\alpha,\beta) (α,β) α ≥ β \alpha \ge \beta αβ 。只需要将评估值v(x)与一对阈值进行比较,可以得到三个区域。
( 1 ) 、 C o ( C k ) = { x ∈ U ∣ v ( x ) &gt; α } (1) 、Co(C^k)=\{x\in U | v(x) &gt;\alpha\} (1)Co(Ck)={xUv(x)>α}
( 2 ) 、 F r ( C k ) = { x ∈ U ∣ β ≤ v ( x ) ≤ α } (2) 、Fr(C^k)=\{x\in U | \beta \le v(x) \le \alpha\} (2)Fr(Ck)={xUβv(x)α}
( 3 ) 、 T r ( C k ) = { x ∈ U ∣ v ( x ) ≤ β } (3) 、Tr(C^k)=\{x\in U | v(x) \le \beta\} (3)Tr(Ck)={xUv(x)β}

三支决策

评价函数v(x):参考相似性测度、距离测度、概率、可能性函数、模糊隶属度、贝叶斯确认测度、子方法测度等。
阈值 α 、 β \alpha、\beta αβ:应该诱导一个优化给定目标函数的三部分。

5. 三支聚类的研究要点

  1. 三支聚类的表示
  2. 怎么获得三支聚类(聚类算法怎么写)
  3. 多种情况时候,开发新的聚类算法

5.1 三支聚类的表示

不同的三支决策解释可以为不同类型的聚类问题提供不同的解决方案。

  1. 一对集合表示
  2. 粗糙集
  3. 区间集
  4. 决策粗糙集
  5. 数学形态学
  6. 模糊集
  7. 阴影集

5.2 怎么获得三支聚类(聚类算法怎么写)

  1. 如何确定阈值
  2. 如何知道簇的真数(真数:真正聚类正确时候,聚类的错误)

5.3. 多种情况时候,开发新的聚类算法

  1. 基于树的增量重叠聚类的三支聚类
  2. 半监督聚类框架
  3. 。。。。
  • 7
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于三支决策聚类理论的DP聚类方法是一种基于贝叶斯非参数模型的聚类算法,它可以自动确定聚类的数量,并且能够处理噪声数据。下面是一个简单的基于三支决策聚类理论的DP聚类方法的Python代码示例: ```python import numpy as np from sklearn.cluster import KMeans from sklearn.mixture import BayesianGaussianMixture def dp_clustering(data, alpha, beta): # 初始化聚类中心 centers = [data] labels = for i in range(1, len(data)): # 计算数据点与聚类中心之间的距离 distances = np.linalg.norm(data[i] - np.array(centers), axis=1) # 计算加入现有聚类的概率 join_probs = beta * np.exp(-alpha * distances) # 计算新建立一个聚类的概率 new_prob = (1 - beta) * alpha / (i + alpha) # 根据概率进行决策 if np.max(join_probs) > new_prob: # 加入现有聚类 label = np.argmax(join_probs) centers[label] = (centers[label] * len(data[label]) + data[i]) / (len(data[label]) + 1) labels.append(label) else: # 新建立一个聚类 centers.append(data[i]) labels.append(len(centers) - 1) return labels # 示例数据 data = np.array([[1, 2], [1, 4], [3, 2], [3, 4], [5, 2], [5, 4]]) # 超参数设置 alpha = 1 beta = 0.5 # 进行DP聚类 labels = dp_clustering(data, alpha, beta) # 打印聚类结果 print("聚类结果:", labels) ``` 这段代码实现了一个简单的基于三支决策聚类理论的DP聚类方法。其中,`data`是输入的数据集,`alpha`和`beta`是超参数,用于控制聚类的数量和决策的权重。函数`dp_clustering`实现了DP聚类的过程,返回每个数据点所属的聚类标签。最后,打印出聚类结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值