python机器学习笔记(一):理论

三种不同方法

  • 监督学习supervised learning
  • 无监督学习unspervised learning
  • 强化学习reinforcement learning

通过监督学习对未来事件进行预测

监督是指训练数据集中的每个样本均有一个已知的输出项(类标(label))

  • 分类
  • 回归(预测)

通过强化学习解决交互式问题

强化学习的目标是构建一个系统(Agent),在与环境(environment)交互的过程中提高系统的性能。
环境的当前状态信息中通常包含一个反馈(reward)信号,在强化学习过程中,这个反馈值不是一个确定的类标或者连续类型的值,而是一个通过反馈函数产生的对当前系统行为的评价。通过与环境的交互,Agent可以通过强化学习来得到一系列行为,通过探索性的试错或借助精心设计的激励系统得到正向反馈最大化。

  • 象棋对弈

通过无监督学习发现数据本身潜在的结构

  • 聚类
  • 数据降维
    无监督降维是数据特征预处理时常用的技术,用于清除数据中的噪声,能够在最大程度保留相关信息的情况下将数据压缩到一个维度较小的子空间,但同时也可能降低某些算法在准确性方面的性能。

机器学习步骤

  • 数据预处理
  • 选择预测模型类型并进行训练
  • 模型验证与使用未知数据进行预测
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值