《机器学习基石》课程笔记(1)

什么是机器学习

什么是学习?学习是人类通过观察世界积累经验进而获得相应技能的过程。而机器学习则是机器(计算机)通过计算数据,像人类一样积累经验并获得技能的过程。
这里写图片描述
机器学习更一般化的定义是Improving some performance measuer with experience computed from data.也就是机器通过计算的手段,利用积累的经验改善系统的性能。比如,让机器去学习股票数据以获得更多的投资收益。

机器学习的本质

这里写图片描述
并不是每个问题都需要机器学习来解决。事实上,有些问题在不使用机器学习的时候会取得更好的效果。那么,我们如何判断是否需要使用机器学习解决问题呢?首先,要存在一些可以被学习的潜在模式(underlying pattern)或规则,也就是说可以提升系统性能;其次,那些潜在模式或规则不能通过编程实现;最后,要有与模式或规则相关的数据,用来作为机器学习算法的输入。

基础符号定义

这里写图片描述
- 输入 xX :机器学习的输入
- 输出 yY :我们想要机器学习告诉我们的答案,也就是机器学习的输出
- 目标函数 f:XY :我们想要学但是又不知道的模式或规律
- 数据 训练样本: D={(x1,y1),(x2,y2),...,(xn,yn)}
- 假说 显著的性能提升: g:XY ,函数 g 就是机器学到的东西,是f的近似

机器学习的流程

这里写图片描述
从数据(与目标函数 f:XY 有关)和假设集合 H 出发,机器学习算法A要算出一个函数 g ,这个函数g要接近于目标函数 f 。其中假设集合H和学习算法 A 被称为机器学习模型。根据机器学习的流程,可以得到机器学习更具体的定义:use data to compute hypothesis g that approximates target f.即通过数据计算出一个近似于目标函数f的假设 g

机器学习和相关领域的关系

机器学习与数据挖掘

  • 机器学习:通过数据计算出一个接近近似于目标函数f的假设 g
  • 数据挖掘:通过(大量的)数据找到一些有趣或有用的性质
  • 如果“有趣的性质”就是直接找出一个假设g,那么机器学习=数据挖掘

    • 如果“有趣的性质”和假设 g 相关,那么机器学习和数据挖掘相辅相成
    • 传统上的数据挖掘常常关注于在大规模数据上的运算效率

    机器学习与人工智能

    • 机器学习:通过数据计算出一个接近近似于目标函数f的假设 g
    • 人工智能:计算某些东西,有一些聪明的表现
    • 机器学习是实现人工智能的一种方法
    • 比如下棋,传统人工智能使用一种叫博弈树(game tree)的方法,而使用机器学习的人工智能则“从棋盘数据中学习”。

    机器学习与统计学

    • 机器学习:通过数据计算出一个接近近似于目标函数f的假设 g
    • 统计学:使用数据做一些我们之前不知道的推论
    • 假设g是一个推论的结果,而目标函数 f <script type="math/tex" id="MathJax-Element-29">f</script>则是我们不知道的东西,从这个角度来说,统计是实现机器学习的方法
    • 传统的统计学常常关注于由数学推导得出的结果,而机器学习更关注于计算
    • 统计学为机器学习提供很多游泳的方法和工具
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值