python中做层次聚类,使用scipy.cluster.hierarchy.fclusterdata方法

本文介绍了在Python中利用scipy.cluster.hierarchy.fclusterdata进行层次聚类的方法,探讨了ward_tree算法的返回值理解,并通过测试不同数据集(包括100维数据及固定样本数100个,不同均值的高斯分布数据)验证了层次聚类的时间复杂度为O(m^2 n)。
摘要由CSDN通过智能技术生成

python机器学习包里面的cluster提供了很多聚类算法,其中ward_tree实现了凝聚层次聚类算法。

但是没有看明白ward_tree的返回值代表了什么含义,遂决定寻找别的实现方式。

经过查找,发现scipy.cluster.hierarchy.fclusterdata能够实现层次聚类。有关这个方法的介绍在:http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.fclusterdata.html

以下是具体的python代码

#coding=utf8
"""
# Author: waleking
# Created Time : 四  7/26 17:05:07 2012
  Last Modified: 二  7/31 17:56:26 2012
# File Name: hierachical.py
# Description:
使用sklearn的层次聚类方法,具体的是ward_tree方法
测试数据采用iris数据,sklearn.datasets.load_iris()
但是发现sklearn.cluster.ward_tree方法没有看懂,实验stackoverflow里面的代码
http://stackoverflow.com/questions/9873840/cant-get-scipy-hierarchical-clustering-to-work
"""
import sklearn.datasets as datasets
import scipy.cluster.hierarchy as hcluster
import numpy.random as random
import numpy as np
import numpy.core.fromnumeric
import time

import matplotlib.pyplot 
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值