《机器学习基石》——林轩田(笔记一)

定义

机器学习:理论与实践相结合的科学。

本课程定位

从方法和技术方面切入都有不同程度的缺点,本课程从基础切入。(机器学习在哲学上的理解,数学方法的推演等)

哲学描述、关键的理论、核心的方法、实践的应用和有帮助的一些笑话的混合是任何一个机器学习者都应该知道的。 ——林轩田

story-like:
- when can ml?(illustrative + technical)
- why can ml?(theoretical + illustrative)
- How can ml?(technical + practical)
- How can ml better?(practical + theoretical)

相关概念

学习:从观察出发,然后通过我们大脑处理而获得技巧的一种能力。
observation→learning→skill
机器学习:模仿人类的学习过程,从数据出发经过处理获得一些技能。
data→ML→skill

什么是技巧?

改善某一种表现的手段,或者说是有某一种表现增进。对ML而言,预测的更准,识别率更高都属于电脑学到了技巧。

机器学习的三个关键:

  • 有一种表现或者效能能够增进,也就是表示这个问题可以学;
  • 一些程式定义很困难,只能交给机器去做;
  • 有资料(数据)。

例子

银行决定是否给客户发放信用卡。
- pattern:customer behavior;
- definition:not easily programmable;
- data:history of bank operation。


机器学习流程的理解:
我们输入一个数据集给电脑 D={(Xi,Yi)(i=1,2...n)} D = { ( X i , Y i ) ( i = 1 , 2... n ) } ,然后电脑根据这个数据集D学习一个模型patten g g ,显然这个模型g与数据集D的原始生成模型 f f 是有差别的,但是我们希望这个g很接近真实的模型 f f ,然后我们再通过g对新的实例进行预测。

机器学习更具体的定义:

机器学习就是我们从资料出发,要算出一个假说,一个hypothesis,也就是上面提到的 g g ,我们希望这个g要很进阶我们真正心里最渴望的那个 f f ,而这个f是用来产生资料的(但是我们不知道 f f 具体是什么)。

  • 数据挖掘VS机器学习:
    数据挖掘希望能够用资料去找出一些有趣的事情。如果将这个“有趣的事情”当做是找到“找到与真实目标f相近的 g g ”那么数据挖掘就跟机器学习是一回事情了。实际上,机器学习和数据挖掘是两个十分相近的领域。
  • 人工智能VS机器学习:
    人工智能希望通过计算某些东西使得计算机表现出一些智能的行为,比如下棋、开车等。如果说机器学习中我们想要找到的gf是一个智能的行为,那么我们就可以说机器学习有助于人工智能,机器学习是人工智能的基础,是实现人工智能的一种方法。

    • 统计VS机器学习
      统计是使用数据对于我们一些不知道的问题作出一些推论。从某种意义上来说机器学习中的 f f 就是我们不知道的事,而g则是我们对于 f f <script type="math/tex" id="MathJax-Element-1449">f</script>的推论,所以从这个角度来说统计实际上是实现机器学习的一种方法。在机器学习里用到了很多统计学的工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值