1.机器学习任务
名称 | 任务 | 监督学习 |
k-近邻算法 | 线性回归 | 是 |
朴素贝叶斯 | 局部加权线性回归 | 是 |
支持向量机 | Ridge回归 | 是 |
决策树 | Lasso最小回归系数估计 | 是 |
K-均值 | 最大期望算法 | 否 |
DBSCAN | Parzen窗设计 | 否 |
2.如何选择合适的机器学习算法
(1)考虑使用机器学习算法目的
如果要预测目标变量值,可选监督学习算法;否则选非监督学习算法;选定了监督方法,需要进一步确定目标变量类型,离散类型可选择分类算法,连续类型选择回归算法
(2)考虑数据问题
了解数据的以下特征,特征值是离散的还是连续性的,特征值中是否包含缺失值,何种原因造成的缺失,数据中是否包含异常值,某个特征发生的频率等。
3.机器学习步骤
(1)收集数据
(2)准备输入数据
(3)分析输入数据:人工分析手中的数据,确保数据集中没有垃圾数据。
(4)训练算法
(5)测试算法
(6)使用算法