数据集链接: https://pan.baidu.com/s/1lYtcc2zlk07Cv9fnto99DA 提取码: sy92
去除冗余属性以及数据离差标准化
#-*- coding: utf-8 -*-
#数据标准化到[0,1]
import pandas as pd
#参数初始化
filename = 'D:/下载/data/input/business_circle.xls' #原始数据文件
standardizedfile = 'D:/下载/data/output/standardized.xls' #标准化后数据保存路径
data = pd.read_excel(filename, index_col = u'基站编号') #读取数据
data = (data - data.min())/(data.max() - data.min()) #离差标准化
data = data.reset_index()
data.to_excel(standardizedfile, index = False) #保存结果
模型构建并画出谱系聚类图
#-*- coding: utf-8 -*-
#谱系聚类图
import pandas as pd
#参数初始化
standardizedfile = 'D:/下载/data/input/standardized.xls' #标准化后的数据文件
data = pd.read_excel(standardizedfile, index_col = u'基站编号') #读取数据
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage,dendrogram
#这里使用scipy的层次聚类函数
Z &