机器学习中常会用到一些基础的分析方法和基本概念,整理知识框架如下。
也可以在之前的博客《常用术语概念汇总》、《常用模型、分析方法及其检验标准》中找到机器学习相关的术语概念和模型。
刚入门的同学最好找一本教材系统学习下,重点体会完整的分析过程、建模和检验的过程,以及背后原理的逻辑和思想。
入门建议选择理性和实践并重的教材,比如《Python机器学习实践》、《集体智慧编程》。边学习边实践,很容易激励起成就感,也容易调起兴趣,同时也打下了基本概念的基础。之后就完全可以靠着从这里激发的兴趣和求知欲来驱动更多理论知识的学习。有了实践的经验之后,一定要找一本教材系统学习理论知识,我个人推荐《Data Mining》这本书,中文版是《数据挖掘导论》。建议直接读英文原版的,没有什么难度,非常容易理解,讲解也很透彻。
对于工作的人来说,最重要的还是要将知识与实践代码(如python或R)相连接,将理论知识和代码实践结合起来。
从我这里整理的基础知识框架中可知,scipy.stats、scipy.stats.model、sklearn模块是统计推断、方差分析、聚类分析、SVM等主要应用的模块,需要重点关注。
详细知识内容块请点击链接去阅读:
1、决策树:
(1)决策树建模基础须知
(2)决策树建模代码实践
2、基于规则的分类器
3、最近邻分类器
4、贝叶斯分类器
(1)朴素贝叶斯分类器基础须知
(2)朴素贝叶斯分类器代码实践
(3)贝叶斯信念网络
5、人工神经网络ANN
6、支持向量机SVM
7、组合分类器
8、层级聚类
9、K-means聚类
10、关联分析