1.主要任务
- 分类任务
- 回归任务:结果是一个连续数字的值,而非一个类别 eg房屋价格、市场分析
一些情况下,回归任务可以简化成分类任务
2.分类一
机器学习的算法上可以分为监督学习、非监督学习、半监督学习、和增强学习
2.1监督学习
给机器的训练数据拥有”标记“或者”答案“
- K邻近
- 线性回归和多项式回归
- 逻辑回归
- SVM
- 决策树和随机森林
2.2非监督学习
给机器的训练数据没有任何”标记“或者”答案“
对没有”标记“的数据进行分类——聚类分析
意义:对数据进行降维处理、异常检测
2.3半监督学习
一部分数据拥有”标记“或者”答案“,另一部分数据没有
更常见:各种原因产生的标记缺失
通常先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测
2.4增强学习
根据周围环境采取行动,根据采取行动的结果,学习行动方式
eg无人驾驶、机器人
3.分类二
3.1 批量学习Batching Learning
优点:简单
如何适应环境变化?——定时重新批量学习
缺点:每次重新批量学习,运算量巨大;在某些环境变化非常快的情况下,甚至不可能
3.2 在线学习Online Learning
优点:及时反映新的环境变化
新的数据带来不好的变化?——加强对数据进行监控
适用数据量巨大,完全无法批量学习的环境
4.分类三
4.1参数学习Parametric Learning
特点:一旦学到了参数,就不再需要原有的数据集
4.2非参数学习Nonparametric Learning
不对模型进行过多的假设
非参数不等于没参数