文章中代码和数据来源于mooc机器学习应用,下面先附上链接:https://www.icourse163.org/course/BIT-1001872001,数据集和slide的获取可以查看本专辑case 0中的相应链接。
在这个例子里给了31个省份消费的数据,通过python对这些数据进行聚类分析。
首先是导入相关的包:
import numpy as np
from sklearn.cluster import KMeans
定义一个读取文件的函数:
def loadData(filePath):#定义一个导入数据的函数
fr=open(filePath,'r+',encoding='gbk')#用open方法打开
lines=fr.readlines()