慕课学习笔记——1机器学习（无监督学习）

最新推荐文章于 2021-04-04 15:47:19 发布

weixin_44081243

最新推荐文章于 2021-04-04 15:47:19 发布

阅读量381

点赞数 1

分类专栏：学习帖文章标签：机器学习 python 无监督学习

本文链接：https://blog.csdn.net/weixin_44081243/article/details/87991664

版权

无监督学习
1. 导学部分
在这里插入图片描述
**tips：**使用聚类要计算距离

tips：使用马氏距离，中心到红点的距离大于中心到绿点的距离（这里不太明白）

**tips：**使用了三种算法：dbscan函数（最快）；近邻传播算法（最慢）；谱聚类算法

在这里插入图片描述

常用聚类算法

降维
用于提高运算性能

常用降维算法

**思考：**上述问题哪些是聚类，哪些是降维问题？
降维：4
聚类：123

2. 聚类算法
2.1 K-means算法
在这里插入图片描述

**Tips：**选取距离各点最近的中心点，由此分为两组，反复评估中心距离各点的距离

聚成4类时明显可以看到消费层级分得比较好了

自己练习的代码

#了解1999年各个省份的消费水平在国内的情况
#Kmeans算法-具体可以通过help（Kmeans）手册查询

import numpy as np 
from sklearn.cluster import KMeans

#一个获取数据的函数
def loadData(filePath):
    #r+读写模式
    fr = open(filePath,'r+')   
    #一次读取全文
    lines = fr.readlines()     
    retData = []     
    retCityName = []   
    #for循环内部用于处理单行数据，循环次数lines(31)次
    for line in lines:  
        #删除作为间隔的逗号
        items = line.strip().split(",") 
        #用于储存城市名称，位于第一列        
        retCityName.append(items[0]) 
        #用于储存城市的各项消费信息
        #for循环单行内的每个元素
        #[float(items[i])这是什么意思？        
        retData.append([float(items[i]) for i in range(1,len(items))])     
    return retData,retCityName 
     
if __name__ == '__main__': 
    #载入数据 
    #loadData是上面创建的函数
    #因为是二维列表，所以赋值符前需要有两个变

最低0.47元/天解锁文章

weixin_44081243

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
慕课学习笔记——1机器学习（无监督学习）

无监督学习1. 导学部分**tips：**使用聚类要计算距离tips：使用马氏距离，中心到红点的距离大于中心到绿点的距离（这里不太明白）**tips：**使用了三种算法：dbscan函数（最快）；近邻传播算法（最慢）；谱聚类算法常用聚类算法降维用于提高运算性能常用降维算法**思考：**上述问题哪些是聚类，哪些是降维问题？降维：4聚类：1232....
复制链接

扫一扫