《统计学习方法》(第十三章)——无监督学习概论

无监督学习概论

无监督学习的基本原理

   无监督学习是从无标注的数据中学习数据的统计规律或者说内在的结构的机器学习,主要包括聚类,降维,概率估计。无监督学习可以用与数据分析或监督学习的前处理
X = [ x 11 . . . . x 1 N . . . . . . . . . . x M 1 . . . . x M N ] X=\begin{bmatrix} x_{11} & .... &x_{1N} \\ ... & .... &... \\ x_{M1} & .... &x_{MN} \end{bmatrix} X=x11...xM1............x1N...xMN
其中为N个样本M维向量组成
它分为3类

  • 数据纵向结构
  • 数据横向结构
  • 数据横向和纵向结构

基本问题

  • 聚类
       把样本中相似的集合分配到同一类,不相似的样本分配到不同类,它又有软聚类和硬聚类
  • 降维
       从高维空间转换到低维空间,通过降维更好的反映数据的结构
  • 概率模型估计
       假设训练数据是从一个概率模型生成的,由训练数据学习概率模型的参数

机器学习三要素

  • 模型
  • 策略
  • 算法

无监督学习方法

  • 聚类
       可以帮助发现数据中的统计规律
  • 降维
       帮助发现高维数据中的统计规律
  • 话题分析
       发现文本集合中每个文件的话题,而话题由单词的集合表示
  • 图分析
       发掘隐藏在图中的统计规律或潜在结构
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值