Chapter 1 算法的概念
算法:定义良好的计算过程。是一系列的计算步骤。
机器学习:研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能
机器学习要素:特征工程(特征的提取,转换,选择),有监督学习(分类,回归),无监督学习(聚类)
数据挖掘:从大量数据中通过算法搜索隐藏与其中的信息的过程。机器学习的更深一层。
数据挖掘重点掌握:线性代数,概率论与数理统计
学习要素:
- 数据预处理
- 分类(决策树,最近邻,svm,贝叶斯)
- 聚类(基于距离,基于密度,基于图,基于概率)
- 关联规则(Apriori)例:在搜索引擎上打错字
- 离群点检测