课源:Python机器学习应用 BIT嵩天,本文作为个人课堂笔记。
准备工作:导论 和 sklearn库的安装
K-means聚类算法
K-means算法定义/举例
**K-means聚类算法实验:
1999省份消费水平数据文件://download.csdn.net/download/Ammo_smartisan/12364455
**
通过聚类,了解1999年各个省份的消费水平在国内的情况。
[city.txt 为1999年各个省份的消费水平在国内的情况,数据文件在资源列表下载即可。
#K-means test
import numpy as np //①建立工程,导入sklearn相关包
from sklearn.cluster import KMeans
def loadData(filePath):
fr = open(filePath,'r+') //r+ 读写打开一个文本文件
lines = fr.readlines() //依次打开整个文件
retData=[]
retCityName=[]
for line in lines:
items = line.strip().split(",")
retCityName.append(items[0]) //城市名称
retData.append([float(items[i])for i in range(1,len(items))]) //城市各项消费信息
return retData,retCityName //返回 该城市名称+消费信息
if __name__ == '__main__':
//②创建K