Python机器学习应用 Unit1 聚类- K-means聚类算法和 DBSCAN密度聚类算法

最新推荐文章于 2024-09-20 11:58:26 发布

鹏酱-CMDI

最新推荐文章于 2024-09-20 11:58:26 发布

阅读量663

点赞数

分类专栏： Machine Learning 课堂笔记文章标签：聚类机器学习 kmeans算法 pca降维 python

本文链接：https://blog.csdn.net/Ammo_smartisan/article/details/105774318

版权

课源：Python机器学习应用 BIT嵩天，本文作为个人课堂笔记。

准备工作：导论和 sklearn库的安装

K-means聚类算法

K-means算法定义/举例

在这里插入图片描述

**K-means聚类算法实验：

1999省份消费水平数据文件：//download.csdn.net/download/Ammo_smartisan/12364455
**

通过聚类，了解1999年各个省份的消费水平在国内的情况。
在这里插入图片描述

[city.txt 为1999年各个省份的消费水平在国内的情况，数据文件在资源列表下载即可。

#K-means test
import numpy as np			//①建立工程，导入sklearn相关包  
from sklearn.cluster import KMeans  

def loadData(filePath):
    fr = open(filePath,'r+')			//r+ 读写打开一个文本文件
    lines = fr.readlines()				//依次打开整个文件
    retData=[]
    retCityName=[]
    for line in lines:
        items = line.strip().split(",")
        retCityName.append(items[0])    //城市名称
        retData.append([float(items[i])for i in range(1,len(items))])  //城市各项消费信息
    return retData,retCityName     //返回 该城市名称+消费信息

if __name__ == '__main__':
	//②创建K