Agglomerative Clustering

最新推荐文章于 2024-01-19 16:18:38 发布

harrisonzh

最新推荐文章于 2024-01-19 16:18:38 发布

阅读量1.5k

点赞数

分类专栏： model

本文链接：https://blog.csdn.net/harrisonzh/article/details/99490075

版权

model 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

import pandas as pd
import numpy as np
import random
from sklearn.cluster import AgglomerativeClustering
import scipy.cluster.hierarchy as shc
import matplotlib.pyplot as plt

# generate data
pages = ['page_{n}'.format(n=page) for page in range(20)]

page_data = pd.DataFrame(index=[i for i in range(10000)])
for i in pages:
    page_data[i] = [random.randrange(0,2,1) for i in range(10000)]

# model
ag = AgglomerativeClustering(n_clusters=2,linkage='ward')

# fit data
page_data_n = page_data[:200]
ag.fit(page_data_n)

# plot dendrogram
plt.figure(figsize=(15, 10))
dend = shc.dendrogram(shc.linkage(page_data_n, method='ward'))

# use sklearn compute distance of paired children, node for linkage matrix for dendrogram
def plot_dendrogram(self, y_top, y_bot, **kwargs):
    distance = np.arange(self.children_.shape[0])
    position = np.arange(2, self.children_.shape[0]+2)

    linkage_matrix = np.column_stack([self.children_, distance, position]).astype(float)

    fig, ax = plt.subplots(figsize=(15, 10))
    shc.dendrogram(linkage_matrix, **kwargs)
    ax.set_ylim(y_bot,y_top)
    plt.show()

plot_dendrogram(ag,y_bot=100, y_top=210, p=100,truncate_mode='lastp',color_threshold=180)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

harrisonzh

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Agglomerative Clustering

import pandas as pdimport numpy as npimport randomfrom sklearn.cluster import AgglomerativeClusteringimport scipy.cluster.hierarchy as shcimport matplotlib.pyplot as plt# generate datapages = ...
复制链接

扫一扫