李航老师《统计学习方法》及相关资源(代码、课件)的汇总及下载

编辑 | Will

出品 | 字节AI

李航:毕业于日本京都大学电气电子工程系,日本东京大学获得计算机科学博士学位。1990年至2001年就职于日本NEC 公司中央研究所,任研究员,2001年至2012年就职于微软亚洲研究院,任高级研究员与主任研究员。2012年至2017年就职于华为技术有限公司诺亚方舟实验室,任首席科学家、主任。现任字节跳动科技有限公司人工智能实验室总监,北京大学、南京大学客座教授,IEEE 会士,ACM 杰出科学家,CCF 高级会员。研究方向包括信息检索,自然语言处理,统计机器学习,及数据挖掘。曾出版过三部学术专著,并在顶级国际学术会议和顶级国际学术期刊上发表过120多篇学术论文,拥有40项授权美国专利。

李航老师编写的《统计学习方法》全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。

《统计学习方法》可以说是机器学习的入门宝典,许多机器学习培训班、互联网企业的面试、笔试题目,很多都参考这本书。 

今天我们将李航老师经典的机器学习资源进行汇总,并整理后提供下载。


 1. 《统计学习方法》(第二版)

《统计学习方法》第一版于 2012年出版,讲述了统计机器学习方法,主要是一些常用的监督学习方法。第二版增加了一些常用的无监督学习方法,由此本书涵盖了传统统计机器学习方法的主要内容。

第二版课程目录:
第1篇 监督掌习
第1章 统计学习及监督学习概论
第2章 感知机
第3章 k近邻法
第4章 朴素贝叶斯法
第5章 决策树
第6章 逻辑斯谛回归与优选熵模型
第7章 支持向量机
第8章 提升方法
第9章 EM算法及其推广
第10章 隐马尔可夫模型
第11章 条件随机场
第12章 监督学习方法总结
第2篇 无监督学习
第13章 无监督学习概论
第14章 聚类方法
第15章 奇异值分解
第16章 主成分分析
第17章 潜在语义分析
第18章 概率潜在语义分析
第19章 马尔可夫链蒙特卡罗法
第20章 潜在狄利克雷分配
第21章 PageRank算法
第22章 无监督学习方法总结
附录A  梯度下降法
附录B  牛顿法和拟牛顿法
附录C  拉格朗日对偶性
附录D  矩阵的基本子空间
附录E  KL散度的定义和狄利克雷分布的性质

我们可以看到:《统计学习方法(第2版)》分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。
《统计学习方法(第2版)》比第一版更全面,而且价格也不高(不到100元还有打折)。这本书是统计机器学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供计算机应用等专业的研发人员参考。

出于版权保护,本文不提供电子书下载,请大家购买正版。


2. 《统计学习方法》的代码实现

《统计学习方法》这本书,附件里并没有代码实现,于是许多研究者复现了里面算法的代码,并放在github里分享,这里介绍几个比较热门的《统计学习方法》代码实现的项目:

 1)https://github.com/fengdu78/lihang-code (标星:13.6k+)

这个仓库由黄海广博士整理,第一版的监督学习方法已经整理完毕(更新完十二章),仓库的主要内容以Jupyter Notebook格式展现,同时介绍书上的主要算法及公式推导。

2)https://github.com/WenDesi/lihang_book_algorithm (标星:4.7k+)

这个仓库不介绍任何机器学习算法的原理,只是将《统计学习方法》中每一章的算法用我自己的方式实现一遍。除了李航书上的算法外,还实现了一些其他机器学习的算法,这个仓库用Python代码实现。(更新完十二章)

3)https://github.com/Dod-o/Statistical-Learning-Method_Code (标星:7k+)

这个仓库力求每行代码都有注释,重要部分注明公式来源。具体会追求下方这样的代码,学习者可以照着公式看程序,让代码有据可查。(更新完二十一章)

代码截图,注释完整且规范

4)https://github.com/SmirkCao/Lihang (标星:4.1k+)

这个仓库用markdown编写,前十二章更新完毕,后面部分也更新了大部分,没有代码,但是,公式推导相当全。


 3. 《统计学习方法》课件

《统计学习方法》第二版的最新课件是由清华大学深圳研究院的袁春教授制作的。我们一起来看看该课件的主要内容。

所有的课件都是 ppt 格式,总共包含 22 章。正好是《统计学习方法》第 2 版的完整内容。

完整版下载见文末!


资源获取

本文搜集了李航老师的《统计学习方法》的相关资源。

以上资源我们已经打包整理完毕!需要的可以按照以下方式获取:

 公众号后台回复关键词:lihang

  • 18
    点赞
  • 253
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 《统计学习方法》是一本经典的机器学习教材,其中介绍了统计学习的基本原理和常用方法李航编写的《统计学习方法》一书在学术界和工业界都有很高的影响力。 对于李航统计学习方法》一书中的MATLAB代码,我不清楚具体指的是书中的哪些代码。该书中没有提供完整的MATLAB代码,但其中给出了一些算法的伪代码和概念性的示例。 如果要在MATLAB中实现书中的算法,可以根据伪代码和示例进行改写和实现。具体的实现方式取决于要实现的算法和具体应用的需求。 一般来说,实现统计学习方法的MATLAB代码需要用到一些基本的数学和编程技巧,如矩阵运算、概率理论、优化算法等。可以利用MATLAB中的矩阵和向量操作的高效性,简化算法的实现过程。 对于不熟悉MATLAB语言的人来说,编写《统计学习方法》的MATLAB代码可能相对困难。此时,可以参考相关机器学习库和工具箱,如MATLAB自带的Statistics and Machine Learning Toolbox或者第三方开源库,来实现相关的算法。 总之,《统计学习方法》一书提供了机器学习算法的理论基础和实现思路,而具体的MATLAB代码的编写取决于实际需求和编程经验。 ### 回答2: 李航的《统计学习方法》是机器学习领域的经典教材之一,其中包含了很多重要的算法和理论。针对这本书中的内容,可以使用MATLAB编写相关代码来实现其中的一些算法。 例如,在书中介绍了支持向量机(SVM)的原理和实现方法。MATLAB提供了一个简单易用的工具箱,可以直接调用其中的函数来实现支持向量机的训练和预测。下面是一个简单的MATLAB代码示例: ``` % 导入数据集 load('data.mat'); X = data(:, 1:2); % 输入特征 y = data(:, 3); % 标签 % 训练支持向量机模型 svm_model = fitcsvm(X, y, 'KernelFunction', 'linear'); % 预测新样本 new_data = [2, 3; 4, 5]; % 新样本特征 labels = predict(svm_model, new_data); % 预测标签 % 输出预测结果 disp(labels); ``` 以上代码首先导入数据集,然后使用`fitcsvm`函数训练了一个线性核的支持向量机模型。接着,我们可以使用这个模型对新的样本进行预测,使用`predict`函数可以得到预测的标签。最后,将预测结果输出到命令行中。 需要注意的是,以上代码只是一个简单的示例,实际应用中可能需要进行更多的数据预处理、调参等操作。而且,书中涉及的其他算法和方法也可以使用类似的方式在MATLAB中进行实现。希望这个简单的示例能够帮助你理解如何在MATLAB中编写《统计学习方法》中的算法代码。 ### 回答3: 李航的《统计学习方法》是一本经典的机器学习教材,其中介绍了统计学习方法的原理、算法和应用。Matlab是一种常用的科学计算软件,也是机器学习中常用的编程语言之一。在学习和实践统计学习方法过程中,我们可以使用Matlab来实现其中的算法和案例。 首先,可以使用Matlab来编写Perceptron算法的实现。Perceptron算法是 Li Haung 在《统计学习方法》中介绍的一种简单的二分类算法。我们可以编写一个函数,输入训练数据集和标签集,利用Perceptron算法进行训练,得到权重向量W和截距b。然后,我们可以使用得到的W和b来预测新的样本数据。这个过程可以使用Matlab的矩阵操作和循环结构来实现。 接下来,可以使用Matlab来实现K近邻算法。K近邻算法是《统计学习方法》中介绍的一种非参数分类算法。我们可以编写一个函数,输入训练数据集、训练标签集和测试数据,计算测试数据与训练数据之间的距离,并找到K个最近邻的样本。然后,根据这K个最近邻的标签来预测测试数据的类别。在Matlab中,可以使用欧氏距离计算距离,并利用排序函数来找出K个最近邻。 另外,我们还可以用Matlab来实现决策树算法。决策树是《统计学习方法》中介绍的一种常用的分类算法。我们可以编写一个函数,输入训练数据集和标签集,通过递归地选择最优特征来构建决策树。然后,使用构建好的决策树来预测新的样本数据的类别。在Matlab中,可以使用选择最优特征的指标和递归函数来构建决策树。 总结来说,通过使用Matlab来实现《统计学习方法》中的算法,我们能更好地理解和应用统计学习方法的原理和算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值