光谱双聚算法————SpectralBiclustering

最新推荐文章于 2024-08-04 02:55:55 发布

yuanzhoulvpi

最新推荐文章于 2024-08-04 02:55:55 发布

阅读量1.7k

点赞数

分类专栏： python sklearn

本文链接：https://blog.csdn.net/yuanzhoulvpi/article/details/86557478

版权

python 同时被 2 个专栏收录

74 篇文章 28 订阅

订阅专栏

sklearn

2 篇文章 0 订阅

订阅专栏


import numpy as np
from matplotlib import pyplot as plt

from sklearn.datasets import make_checkerboard
from sklearn.datasets import samples_generator as sg
from sklearn.cluster.bicluster import SpectralBiclustering
from sklearn.metrics import consensus_score

n_clusters = (4, 3)
data, rows, columns = make_checkerboard(
    shape=(300, 300), n_clusters=n_clusters, noise=10,
    shuffle=False, random_state=0)

plt.matshow(data, cmap=plt.cm.Blues)
plt.title("Original dataset")

data, row_idx, col_idx = sg._shuffle(data, random_state=0)
plt.matshow(data, cmap=plt.cm.Blues)
plt.title("Shuffled dataset")

model = SpectralBiclustering(n_clusters=n_clusters, method='log',
                             random_state=0)
model.fit(data)
score = consensus_score(model.biclusters_,
                        (rows[:, row_idx], columns[:, col_idx]))

print("consensus score: {:.1f}".format(score))

fit_data = data[np.argsort(model.row_labels_)]
fit_data = fit_data[:, np.argsort(model.column_labels_)]

plt.matshow(fit_data, cmap=plt.cm.Blues)
plt.title("After biclustering; rearranged to show biclusters")

plt.matshow(np.outer(np.sort(model.row_labels_) + 1,
                     np.sort(model.column_labels_) + 1),
            cmap=plt.cm.Blues)
plt.title("Checkerboard structure of rearranged data")

plt.show()

在这里面，有数据产生，以及如何使用scikit-learn来处理。有个过程，我觉得可以搜到这个关键词，代码基本上不是问题了