复现经典:《统计学习方法》第22章 无监督学习方法总结

第22章 无监督学习方法总结

本文是李航老师的《统计学习方法》一书的代码复现。作者:黄海广

备注:代码都可以在github中下载。我将陆续将代码发布在公众号“机器学习初学者”,可以在这个专辑在线阅读。

无监督学习方法的关系和特点

第2篇详细介绍了八种常用的统计机器学习方法,即聚类方法(包括层次聚类与k均值聚类)、奇异值分解(SVD)、主成分分析(PCA)、无监督学习方法总结 22.1无监潜在语义分析(LSA)、概率潜在语义分析(PLSA)、马尔可夫链蒙特卡罗法(CMC,包括 Metropolis-Hastings-算法和吉布斯抽样)、潜在狄利克雷分配(LDA)、 PageRank算法。此外,还简单介绍了另外三种常用的统计机器学习方法,即非负矩阵分解(NMF)变分推理、幂法。这些方法通常用于无监督学习的聚类、降维、话题分析以及图分析。

表 无监督学习方法的特点


方法模型策略算法
聚类层次聚类聚类树类内样本距离最小启发式算法

k均值聚类k中心聚类样本与类中心距离最小迭代算法

高斯混合模型高斯混合模型似然函数最大EM算法
降维PCA低维正交空间方差最大SVD
话题分析LSA矩阵分解模型平方损失最小SVD

NMF矩阵分解模型平方损失最小非负矩阵分解

PLSAPLSA模型似然函数最大EM算法

LDALDA模型后验概率估计吉布斯抽样,变分推理
图分析PageRank有向图上的马尔可夫链平稳分布求解幂法

表 含有隐变量概率模型的学习方法的特点

算法基本原理收敛性收敛速度实现难易度适合问题
EM算法迭代计算、后验概率估计收敛于局部最优较快容易简单模型
变分推理迭代计算、后验概率近似估计收敛于局部最优较慢较复杂复杂模型
吉布斯抽样随机抽样、后验概率估计依概率收敛于全局最优较慢容易复杂模型

表 矩阵分解的角度看话题模型

下载地址

https://github.com/fengdu78/lihang-code

参考资料:

[1] 《统计学习方法》: https://baike.baidu.com/item/统计学习方法/10430179

[2] 黄海广: https://github.com/fengdu78

[3]  github: https://github.com/fengdu78/lihang-code

想脱单,找湾区人工智能

认识帅张,维权不再难

用法律武器,痛击腾讯侵权行为!!!湾区人工智能可以改善知识产权现状吗?

【中美之争】其实已经失去了悬念 (深度好文)|湾区人工智能

【欧洲已死】李开复:欧洲人工智能毫无希望

80后,天才程序员, Facebook 第一任 CTO,看看开挂的人生到底有多变态?

【厂妹进谷歌】从富士康流水线小妹到 Google 工程师,She made it !!!

【刚刚】世界顶级名校:美国斯坦福大学在人工智能领域诞生了一位来自中国的女神

【24万欧】国外人工智能计算机博士自述面试经历

看看你的母校是否开通了人工智能及其相关专业

IT行业高工资的时代已经结束了 | 紫竹张先生

凌晨一点的粤海街道对抗来自美国的力量|湾区人工智能

进入顶层社会的顺序是什么?

程序员的周末是风花雪月还是孤独寂寞?

每天都要刷碗的清贫博士后,生活捉襟见肘,国外华人也不容易

农村的未来,一|深度揭秘俄罗斯远东真相(上)|湾区人工智能

为什么农村出来的大学生大多混得比较差?

【月薪三万】听说深圳老师工资全国最高!!!比德国还高

【幸福的猪】德国难民躺赢的人生:和三个老婆造人就是神圣不可侮辱的职业

长按扫码撩海归

   觉得不错, 请随意转发,麻烦点个在看!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值