三种不同方法
- 监督学习supervised learning
- 无监督学习unspervised learning
- 强化学习reinforcement learning
通过监督学习对未来事件进行预测
监督是指训练数据集中的每个样本均有一个已知的输出项(类标(label))
- 分类
- 回归(预测)
通过强化学习解决交互式问题
强化学习的目标是构建一个系统(Agent),在与环境(environment)交互的过程中提高系统的性能。
环境的当前状态信息中通常包含一个反馈(reward)信号,在强化学习过程中,这个反馈值不是一个确定的类标或者连续类型的值,而是一个通过反馈函数产生的对当前系统行为的评价。通过与环境的交互,Agent可以通过强化学习来得到一系列行为,通过探索性的试错或借助精心设计的激励系统得到正向反馈最大化。
- 象棋对弈
通过无监督学习发现数据本身潜在的结构
- 聚类
- 数据降维
无监督降维是数据特征预处理时常用的技术,用于清除数据中的噪声,能够在最大程度保留相关信息的情况下将数据压缩到一个维度较小的子空间,但同时也可能降低某些算法在准确性方面的性能。
机器学习步骤
- 数据预处理
- 选择预测模型类型并进行训练
- 模型验证与使用未知数据进行预测