机器学习最大的特点是利用数据而不是指令来进行各种工作,其学习过程主要包括:数据的特征提取、数据预处理、训练模型、测试模型、模型评估改进等几部分。
二、机器学习算法:
机器学习算法可以分为传统的机器学习算法和深度学习。
传统机器学习算法主要包括以下五类:
- 回归:建立一个回归方程来预测目标值,用于连续型分布预测
- 分类:给定大量带标签的数据,计算出未知标签样本的标签取值
- 聚类:将不带标签的数据根据距离聚集成不同的簇,每一簇数据有共同的特征
- 关联分析:计算出数据之间的频繁项集合
- 降维:原高维空间中的数据点映射到低维度的空间中
线性回归:找到一条直线来预测目标值
逻辑回归:找到一条直线来分类数据
K-近邻:用距离度量最相邻的分类标签
朴素贝叶斯:选择后验概率最大的类为分类标签
决策树:构造一棵熵值下降最快的分类树
支持向量机(SVM):构造超平面,分类非线性数据
PCA降维:减少数据维度,降低数据复杂度
人工神经网络:逐层抽象,逼近任意函数