半监督学习
监督学习Supervised Learning(有数据集有标签)
数据集 -> 训练 -> 验证 -> 模型投入使用
无监督学习Unsupervised Learning(有数据集无标签)
尝试寻找数据中的模式 如:聚类(组织成群)、异常检测(查找异常值)
无监督学习技术:
- 自编码 Auto encoding
- 主成分分析 Principle Components Analysis
- 随机森林 Random forests
- K均值聚类 K-means clustering
- 生成对抗网络 Generative Adversarial Networks(生成器+鉴别器)
强化学习(RL)Reinforcement Learning(无标签 奖惩机制)
以试错的方式进行学习,通过与环境进行交互获得的奖赏指导行为,最大化长期未来奖励,寻找最大的回报。
强化学习方法可以是在线学习思想的一种实现,但是在线学习的数据流一定是增加的,而强化学习的数据可以做减少(先收集,更新时按丢掉差数据的方向)。而且在线学习对于获得的数据是用完就丢,强化学习是存起来一起作为既往的经验。