以正确的姿态入门机器学习

最新推荐文章于 2021-11-25 20:53:25 发布

知识的港湾

最新推荐文章于 2021-11-25 20:53:25 发布

阅读量778

点赞数 4

文章标签：机器学习

本文链接：https://blog.csdn.net/zhouzhaoxiong1227/article/details/106729929

版权

“无意中发现了一个巨牛的人工智能教程，忍不住分享一下给大家。教程不仅是零基础，通俗易懂，而且非常风趣幽默，像看小说一样！觉得太牛了，所以分享给大家。点这里可以跳转到教程。”

大家可能已经注意到了，现在很多互联网公司都在招聘机器学习工程师，这个岗位也被很多媒体定义为当前最热门的岗位之一。也许我们并没有从事相关工作，但是了解机器学习相关的知识还是很有必要的。那么，机器学习到底是什么呢？它的知识体系是什么样的呢？我们该如何入门机器学习呢？带着这种种的疑问，我学习了极客时间 App 上的《机器学习 40 讲》专栏。本专栏作者和《人工智能基础课》专栏一样，也是王天一老师。

通过对本专栏的学习，我对机器学习有了全面的了解。在这篇文章中，我分享一下自己的学习总结，供各位想入门机器学习的朋友参考。

专栏主要内容

作者在开篇词中提到，再炫目的技术归根结底都是基本模型与方法在具体领域问题上的组合，而理解这些基本模型与方法才是掌握机器学习，也是掌握任何一门学问的要义所在。专栏的一大特色是融会贯通的系统性，它最重要的任务就是帮助我们把握不同模型之间的内在关联，让我们形成观察机器学习的宏观视角，找准进一步理解与创新的方向。

本专栏的主要内容分为三个部分，分别是：机器学习概观、统计机器学习模型、概率图模型。

我用下面这张思维导图来概括本专栏的主要内容。

机器学习概观

作者提到，目前机器学习主要有两大流派：频率学派(Frequentist)和贝叶斯学派(Bayesian)，分别对应了频率视角下的机器学习和贝叶斯视角下的机器学习。将频率主义“参数确定，数据随机”的思路应用在机器学习当中，得到的就是统计机器学习(statistical learning)；和参数相关的信息全部来源于数据，输出的则是未知参数唯一的估计结果，这是统计机器学习的核心特征。贝叶斯学派对应机器学习中的概率图模型，可以在模型预测和选择中提供更加完整的信息。虽然两种视角各有优劣，但将两种方法论融会贯通才是理解机器学习的正确思路。

这部分的内容还包括：学什么与怎么学、计算学习理论、模型的分类方式、模型的设计准则、模型的验证方法、模型的评估指标、实验设计、特征预处理。

统计机器学习模型

在这部分内容的开始，作者就提到，虽然统计机器学习中的模型很多，但它们都来源于最原始的线性回归(linear regression)。作者认为，线性模型最大的优点是便于解释，它能以简洁明了的方式清晰体现出输入的变化如何导致输出的变化。

线性回归是所有机器学习模型的鼻祖，其原因不仅源于它悠久的历史，还在于它三个最基本的特点：线性、全局性、数据不变性。要应对复杂的环境，就需要对线性回归的这三个特点进行改造，线性特性改造的过程大致遵循“属性非线性——参数非线性——全局非线性”的路线图，全局性特性改造的过程可以描述为“结构化局部——非结构化局部——分布式表示”，数据不变性特性的改造可以近似地划分成“直接降维——线性降维——非线性降维”这样几个类别。

这部分的主要内容包括：基础线性回归(一元与多元)、正则化处理(收缩方法与边际化)、线性降维(主成分的使用)、非线性降维(流形学习)、从回归到分类(联系函数与降维)、建模非正态分布(广义线性模型)、几何角度看分类(支持向量机)、从全局到局部(核技巧)、非参数化的局部模型(K近邻)、基于距离的学习(聚类与度量学习)、基函数扩展(属性的非线性化)、自适应的基函数(神经网络)、层次化的神经网络(深度学习)、深度编解码(表示学习)、基于特征的区域划分(树模型)、集成化处理(Boosting 与 Bagging)、万能模型(梯度提升与随机森林)。

概率图模型

作者提到，要简洁明快地表达多个变量之间的复杂的相关关系，图模型无疑是理想的选择；将图模型和概率模型结合起来，就是概率图模型(probabilistic graphical model)。概率模型基本上都属于生成模型，它们可以建模数据的生成机制，这和统计机器学习以判别模型为主的特色形成鲜明的对比。

作者从最简单的概率图模型——朴素贝叶斯分类器(naive Bayes classifier)讲起，并以它作为从统计机器学习到概率图模型的过渡。

这部分的主要内容包括：最简单的概率图(朴素贝叶斯)、有向图模型(贝叶斯网络)、无向图模型(马尔可夫随机场)、建模连续分布(高斯网络)、从有限到无限(高斯过程)、序列化建模(隐马尔可夫模型)、连续序列化模型(线性动态系统)、精确推断(变量消除及其拓展)、确定近似推断(变分贝叶斯)、随机近似推断(MCMC)、完备数据下的参数学习(有向图与无向图)、隐变量下的参数学习(EM方法与混合模型)、结构学习(基于约束与基于评分)。