DM Hw6

Hw6 聚类

1

a

在这里插入图片描述


b

一个点不来自某个特定簇的概率是 1 − 1 K 1-\frac{1}{K} 1K1
对所有 2 K 2K 2K 个点都不来自该簇的概率是 ( 1 − 1 K ) 2 K (1-\frac{1}{K})^{2K} (1K1)2K
则 至少一个点来自该簇的概率为 1 − ( 1 − 1 K ) 2 K 1-(1-\frac{1}{K})^{2K} 1(1K1)2K
所以最终样本至少包含来自每个簇的一个点的概率是 ( 1 − ( 1 − 1 K ) 2 K ) K (1-(1-\frac{1}{K})^{2K})^{K} (1(1K1)2K)K

K = 10 K=10 K=10 时, p = 0.27 p=0.27 p=0.27
K = 100 K=100 K=100 时, p = 5.66 e − 07 p=5.66e-07 p=5.66e07
K = 1000 K=1000 K=1000 时, p = 8.24 e − 64 p=8.24e-64 p=8.24e64


2

a

基于中心:2个簇,长方形区域会对半分。
基于邻近性:1个簇,因为有噪声
基于密度:2个簇,是2个圆形区域,噪声不会造成影响


b

基于中心:1个簇,包括了所有环
基于邻近性:2个簇,是2个环形区域
基于密度:2个簇,是2个环形区域


c

基于中心:3个簇,是3个三角形区域
基于邻近性:1个簇,三个三角形有交点因此会被合并
基于密度:3个簇,虽然它们有交点,但交点处密度低


d

基于中心:2个簇,左右各一个
基于邻近性:5个簇,每条线是一个簇
基于密度:2个簇


3

在这里插入图片描述

a

有无限种划分方法,任意一条直径即可
两个质心在该直径的垂直平分线上
是全局最小


b

从真实点作为初始质心开始,因为两个圆的边之间的距离略大于圆的半径,所以:将两个圆划分开,再用直径分割其中一个圆。
有无限种方法
两个半圆的质心同上一问,另一个是完整圆的中心
是全局最小


c

在初始质心是实际数据点的现实情况下,三个框显示了将导致的三个簇。


d

具体见图
在第一种情况下,这两个簇是局部最小。
在第二种情况下,这两个簇是全局最小。


e

具体见图,两个顶部簇被包含在两个框内,而第三个簇被三角形和矩形定义的区域包含。(图中较小的两个簇应为对称的。)我认为第二个解决方案——由一名学生提出——也是可能的,尽管它是一个局部最小值,在这种点的配置下可能很少见。注意,虽然从较大圆中切出的两个扇形被显示为相交于一点,但不一定是这种情况——这取决于圆的确切位置和大小。两个扇形切口之间可能存在一个间隙,由第三个(较大)簇填充。(想象小圆在相对两侧。)或者两个扇形切口之间的边界实际上可以是线段。


4

单链:

在这里插入图片描述

全链:

在这里插入图片描述


5

纯度
#10.200.98
#21.840.53
#31.700.49
合计1.440.61

6

相似度矩阵: x = < 0.8 , 0.65 , 0.55 , 0.7 , 0.6 , 0.3 > x=<0.8,0.65,0.55,0.7,0.6,0.3> x=<0.8,0.65,0.55,0.7,0.6,0.3>
理想的相似度矩阵: y = < 1 , 0 , 0 , 0 , 0 , 1 > y=<1,0,0,0,0,1> y=<1,0,0,0,0,1>

方差:
σ x = 0.1703 σ_x = 0.1703 σx=0.1703
σ y = 0.5164 σ_y = 0.5164 σy=0.5164

c o v ( x , y ) = − 0.2 cov(x,y) = -0.2 cov(x,y)=0.2

c o r r ( x , y ) = c o v ( x , y ) σ x σ y = − 0.227 corr(x,y) = \frac{cov(x,y)}{ σ_xσ_y}= -0.227 corr(x,y)=σxσycov(x,y)=0.227


7

  • 簇1 {p1,p2,p3,p4,p5,p6,p7,p8}
    • A A A
      R ( A , 1 ) = 3 3 = 1 R(A,1) = \frac{3}{3} = 1 R(A,1)=33=1
      P ( A , 1 ) = 3 8 = 0.375 P(A,1) = \frac{3}{8} = 0.375 P(A,1)=83=0.375
      F ( A , 1 ) = 2 × 1 × 0.375 1 + 0.375 = 0.55 F(A,1) = 2 × 1 ×\frac{0.375}{1+0.375} = 0.55 F(A,1)=2×1×1+0.3750.375=0.55
    • B B B
      R ( B , 1 ) = 5 5 = 1 R(B,1) = \frac{5}{5} = 1 R(B,1)=55=1
      P ( B , 1 ) = 5 8 = 0.625 P(B,1) = \frac{5}{8} = 0.625 P(B,1)=85=0.625
      F ( B , 1 ) = 2 × 1 × 0.625 1 + 0.625 = 0.77 F(B,1) = 2 × 1 × \frac{0.625}{1+0.625} = 0.77 F(B,1)=2×1×1+0.6250.625=0.77

  • 簇2 {p1,p2,p4,p5}
    • A A A
      R ( A , 2 ) = 2 3 R(A,2) = \frac{2}{3} R(A,2)=32
      P ( A , 2 ) = 2 4 P(A,2) = \frac{2}{4} P(A,2)=42
      F ( A , 2 ) = 0.57 F(A,2) = 0.57 F(A,2)=0.57
    • B B B
      R ( B , 2 ) = 2 5 R(B,2) = \frac{2}{5} R(B,2)=52
      P ( B , 2 ) = 2 4 P(B,2) = \frac{2}{4} P(B,2)=42
      F ( B , 2 ) = 0.44 F(B,2) =0.44 F(B,2)=0.44

  • 簇3 {p3,p6,p7,p8}
    • A A A
      R ( A , 3 ) = 1 3 R(A,3) = \frac{1}{3} R(A,3)=31
      P ( A , 3 ) = 1 4 P(A,3) = \frac{1}{4} P(A,3)=41
      F ( A , 3 ) = 0.29 F(A,3) = 0.29 F(A,3)=0.29
    • B B B
      R ( B , 3 ) = 3 5 R(B,3) = \frac{3}{5} R(B,3)=53
      P ( B , 3 ) = 3 4 P(B,3) = \frac{3}{4} P(B,3)=43
      F ( B , 3 ) = 0.67 F(B,3) =0.67 F(B,3)=0.67

  • 簇4 {p1,p2}
    • A A A
      R ( A , 4 ) = 2 3 R(A,4) = \frac{2}{3} R(A,4)=32
      P ( A , 4 ) = 2 2 P(A,4) = \frac{2}{2} P(A,4)=22
      F ( A , 4 ) = 0.8 F(A,4) = 0.8 F(A,4)=0.8
    • B B B
      R ( B , 4 ) = 0 5 R(B,4) = \frac{0}{5} R(B,4)=50
      P ( B , 4 ) = 0 2 P(B,4) = \frac{0}{2} P(B,4)=20
      F ( B , 4 ) = 0 F(B,4) =0 F(B,4)=0

  • 簇5 {p4,p5}
    • A A A
      R ( A , 5 ) = 0 R(A,5) = 0 R(A,5)=0
      P ( A , 5 ) = 0 P(A,5) = 0 P(A,5)=0
      F ( A , 5 ) = 0 F(A,5) = 0 F(A,5)=0
    • B B B
      R ( B , 5 ) = 2 5 R(B,5) = \frac{2}{5} R(B,5)=52
      P ( B , 5 ) = 2 2 P(B,5) = \frac{2}{2} P(B,5)=22
      F ( B , 5 ) = 0.57 F(B,5) =0.57 F(B,5)=0.57

  • 簇6 {p3,p6}
    • A A A
      R ( A , 6 ) = 1 3 R(A,6) = \frac{1}{3} R(A,6)=31
      P ( A , 6 ) = 1 2 P(A,6) = \frac{1}{2} P(A,6)=21
      F ( A , 6 ) = 0.4 F(A,6) = 0.4 F(A,6)=0.4
    • B B B
      R ( B , 6 ) = 1 5 R(B,6) = \frac{1}{5} R(B,6)=51
      P ( B , 6 ) = 1 2 P(B,6) = \frac{1}{2} P(B,6)=21
      F ( B , 6 ) = 0.29 F(B,6) =0.29 F(B,6)=0.29

  • 簇7 {p7,p8}
    • A A A
      R ( A , 7 ) = 0 R(A,7) = 0 R(A,7)=0
      P ( A , 7 ) = 0 P(A,7) = 0 P(A,7)=0
      F ( A , 7 ) = 0 F(A,7) = 0 F(A,7)=0
    • B B B
      R ( B , 7 ) = 2 5 R(B,7) = \frac{2}{5} R(B,7)=52
      P ( B , 7 ) = 2 2 P(B,7) = \frac{2}{2} P(B,7)=22
      F ( B , 7 ) = 0.57 F(B,7) =0.57 F(B,7)=0.57

所以,
对类 A A A F ( A ) = m a x F ( A , i ) = 0.8 F(A) = max{F(A,i)} = 0.8 F(A)=maxF(A,i)=0.8
对类 B B B F ( B ) = m a x F ( B , i ) = 0.77 F(B) = max{F(B,i)} = 0.77 F(B)=maxF(B,i)=0.77

F = 3 8 × F ( A ) + 5 8 × F ( B ) = 0.78 F = \frac{3}{8} × F(A) + \frac{5}{8} ×F(B) = 0.78 F=83×F(A)+85×F(B)=0.78


8

1 → D 1\rightarrow D 1D
2 → C 2\rightarrow C 2C
3 → A 3\rightarrow A 3A
4 → B 4\rightarrow B 4B


9

SNN相似度:

1234
12001
20210
30120
41002

  • 30
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值