机器学习-无监督学习1

无监督学习简介

  • 无监督学习的概述
  • k-means算法的介绍
  • 主成分分析(PCA)介绍
  • 流形学习介绍之LLE
无监督学习的概述

无监督学习的概念与意义

概念:在没有标签即Y的数据下的学习方法,叫做无监督学习。例如,将用户根据历史的操作行为进行聚类分析。

意义

  • 根据事物的本身属性去分辨事物,训练样本标记信息未知,可以通过对无标记训练样本的学习来揭示数据的内在性质和规律,为进一步数据分析提供基础。
  • 与监督学习相结合,产生半监督学习等。
  • 用于神经网络隐藏层的感知函数定义等。
    无监督学习与人类的学习过程相类似。

无监督学习的主要方法

  • 聚类:k-means、层次聚类、密度聚类
  • 神经网络中的稀疏化编码
  • 降维:PCA

无监督学习的主要应用

  • 群体分类、挖掘分割
  • 挖掘数据内部特征
k-means算法的介绍

聚类算法的主要思想
物以类聚,人以群分
定义距离的度量:
在这里插入图片描述
在这里插入图片描述
常见的相似性和距离度量方式

  • 明可夫斯基距离
    在这里插入图片描述
  • 杰卡德相似系数(数据维度不同可化为同维)
    在这里插入图片描述
  • 余弦相似度
    在这里插入图片描述

k-means的主要算法
k-means算法是很典型的基于距离的聚类算法,将距离作为相似性的评价指标。它可以将具有相似性的样本聚成一类。
算法具体流程
在这里插入图片描述
目标函数及求解
在这里插入图片描述
k-means的分析和扩展

怎样选择聚类数目

  • Canopy算法
  • 实际的先验知识(或业务数据逻辑)
    在这里插入图片描述
    Canopy算法流程在这里插入图片描述
    聚类衡量指标
  • 均一性
  • 完整性
  • V-measure ARI
  • AMI
  • 轮廓系数
    在这里插入图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值