《机器学习基石》笔记:第一讲

林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典,从哲学原理讲到算法核心,深入浅出,非常详细。但存在两个问题:
1.林老师是台湾(省)人,很多舶来品词语的翻译和大陆不同,加上林老师讲的比较快,一次听明白还是不容易的。
2.由于课程是视频形式,回头复习比较麻烦。 因此,想把每节课的重要内容以笔记的形式记录下来,以供未来反复回头翻看。希望能坚持下来:)
下面开始正式内容。


1.课程介绍
本课程目的是“基石”导向的,力求学习者通晓原理又熟悉技巧,既不是枯燥的将理论,也不是速成式的讲算法(算法那么多,怎么学也学不完)。
2.什么是机器学习?
人类的学习过程是从大量经验中,通过观察学到技能。机器学习则是计算机(模型)从大量数据(data)中学到技能(skill)。
那么,什么是skill?skill就是在一个业务场景中提升某个指标,比如在股票投资中,模型通过大量data学习,使得投资者的股票回报率提高了,那么这就是学到了skill。
那么,为什么我们要使用机器学习(用其他的技术不行吗)?比如说要你在1000张图片中分辨哪些图片中包含树。此时,通过编写规则难以做到,我们无法(很难)将树的定义用数学抽象表达。因此,此类场景需要机器学习。
那么,使用机器学习的关键是什么?(1)存在潜在的模式(pattern)可供学习(2)人工编写规则难以做到(3)存在足量的该pattern生成的data。
机器学习的应用涵盖了我们的衣食住行教育娱乐等日常生活,典型应用有NLP、IR、RS等。
那么,一个机器学习应用包含哪些基本成分?(1)input:X(2)output:Y(3)f:X–>Y(f代表pattern,也就是我们未知但是想求出的一种对应法则)(4)training set:D(5)hypothesis set(假设空间),也就是g的全集。(5)g:X–Y(我们想求得f但是求之不得,所以通过data求一个近似于f的g来代替f)
这里写图片描述
3.机器学习的流程:
这里写图片描述
那么,机器学习和数据挖掘、人工智能、统计学等这些学科领域的关系是怎样的?
首先,机器学习是希望通过data来近似求得一个和f相似的g。
而数据挖掘则是通过data发掘有趣(interesting)的事情,数据挖掘包含的范围更大。
其次,机器学习是(目前看来)实现人工智能的一个最佳途径。
最后,机器学习里面使用的很多方法都是统计学家在很早以前发现的。统计学领域更注重用数学方法预测假设,不太重视大量的数据计算。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值