先贴一个链接,我觉得这个博主写的好,过程也很详细。我是按照他最下方的算法流程写的。有问题的话也希望大家提出来。
数据挖掘——谱聚类(spectral clustering)基本原理及python实现
我的数据是鸢尾花数据集,这里就不提供下载地址了,大家网上一搜都有。我们直接进行实现过程。
导入数据:
df = pd.read_csv("iris.txt", header=None, sep="\s+")
df.head()
去掉标签列
df = df.iloc[:, :4]
df.head()
我这里对数据进行了归一化处理,其实也不用,我用了是因为要习惯以后的数据处理。我就不贴代码了,大家忽略这一步,不影响后续的步骤,结果可能会跟我有点误差。
数据的格式:
我们创建一个空矩阵: