机器学习流程,算法部分主要说明经典算法
1.获取数据
2.数据基本处理--对数据进行缺失值, 去除异常值处理
3.特征工程:
特征提取---对杂乱的数据进行转换
特征预处理-对数据进行相同量纲处理
特征降维---减少特征个数
4.模型训练: 使用算法对模型进行训练
1.监督学习--有特征值, 有目标值(目标值连续/离散)
回归--线性回归, 岭回归
分类--逻辑回归, k邻近算法, 决策树, 贝叶斯分类, 神经网络
2.半监督学习,
3.强化学习是半监督学习还是无监督学习? 动态规划, 马尔科夫决策
4.无监督学习
聚类--kmeans
5.模型评估--由于主要学习监督学习, 所以评估包括
1.分类模型评估
准确率
精确率
召回率
F1-score
AUC指标
2.回归模型评估
均方根误差,RMSE, root mean squared error
相对平方误差,RSE, relative squared error
平均绝对误差,MAE, mean absolute error
相对绝对误差,RAE, relative absolute error
决定系数,
无监督/半监督/强化学习的模型评估没有!!!
## 机器学习前三部分, 都是对数据的处理,为什么重视对数据的处理?
数据和特征决定了机器学习的上限,算法和模型只是逼近这个上限