机器学习01

  • 工具:

Matlab

Octave(开源)


  • Definition
    • Arthur Samuel (1959):
      • Field of study that gives computers the ability to learn without being explicitly programmed.  (不直接编程)
    • Tom Mitchell (1998):
      • Well-posed learning problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. (学习了经验E之后程序在问题T上的性能有所提高,性能由P来衡量)

  • 课程分块
    • Supervised learning 监督学习
提供了标准答案用于学习。要求:面对新的输入,给予一个输出。
      • regression(回归) 连续的问题
例如:
提供当地一些房子的面积和房价。现在输入一个房子面积,要求给出一个合适的报价。
      • classification(分类) 离散的问题

例如:

提供一些医疗数据,包含了肿瘤患者的年龄,性别,肿瘤的面积,肿瘤的性质(恶性或者良性)。现在输入一个人的性别,肿瘤的面积,要求判断肿瘤的性质(恶性或者良性)

    • Learning theory
    • Unsupervised learning 无监督学习

没有标准答案,只有数据,让算法找出数据本身的结构。

      • clustering(聚类)
    • Reinforcement learning 强化学习
不是作出一个决策,而是一系列决策。并不要求每个决策都是正确的,只要大部分决策正确就ok。
核心:回报函数 reward function
根据reward function的值来定义一个behavior的好坏。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值