层次聚类(AGNES)

1、算法描述

在这里插入图片描述

2、python代码实现

import  numpy as np
import matplotlib.pyplot as plt

'''
AGNES层次聚类,采用自底向上聚合策略的算法。先将数据集的每个样本看做一个初始的聚类簇,然后算法运行的每一步中找出距离最近的两个
类簇进行合并,该过程不断重复,直至达到预设的聚类簇的个数。
'''
#计算两个向量之间的欧式距离
def calDist(X1 , X2 ):
    sum = 0
    for x1 , x2 in zip(X1 , X2):
        sum += (x1 - x2) ** 2
    return sum ** 0.5
def updateClusterDis(dataset,distance,sets,cluster_i):
    i=0
    while i<len(sets):
        dis = []
        for e in sets[i]:
            for ele in sets[cluster_i]:
                dis.append(calDist(dataset[e],dataset[ele]))
        distance[i,cluster_i]=max(dis)
        distance[cluster_i,i]=max(dis)
        i+=1
    #将每个簇和自身距离设为无穷大
    distance[np.diag_indices_from(distance)] = float('inf')
    return distance
def agens(dataset,k):
#初始化聚类簇:让每一个点都代表,一个类簇
    sets=[]
    for i in range(0,len(dataset)):
        sets.append({i})
#初始化类簇间距离的矩阵
    delta = np.array(dataset[0] - dataset)
    for e in dataset[1:, :]:
        delta = np.vstack((delta, (e - dataset)))
    distance = np.sqrt(np.sum(np.square(delta), axis=1))
    distance = np.reshape(distance, (len(dataset), len(dataset)))
    distance[np.diag_indices_from(distance)]=float('inf')
####################################################
    while len(sets)>k:
        locations=np.argwhere(distance==np.min(distance))
        #将集合合并,删除被合并的集合
        locations=locations[locations[:,0]<locations[:,1]]
        cluster_i=locations[0,0]
        cluster_j=locations[0,1]
        for e in sets[cluster_j]:
            sets[cluster_i].add(e)
        del sets[cluster_j]
        #删除被合并的簇,distance矩阵对应的行和列,并更新距离矩阵
        distance=np.delete(distance,cluster_j,axis=0)#删除对应列
        distance=np.delete(distance,cluster_j,axis=1)#删除对应行
        distance=updateClusterDis(dataset,distance,sets,cluster_i)
    print(sets)
    return sets
#测试代码,使用西瓜书数据集4.0
dataset=np.loadtxt('data.txt')
results=agens(dataset,4)

for r  in  results:
    drawpoints = []
    for points in r:
        drawpoints.append(points)
    drawdata=dataset[drawpoints]
    plt.scatter(drawdata[:, 0], drawdata[:, 1], marker='o')

plt.show()

3、结果

在这里插入图片描述

  • 5
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值