【林轩田】机器学习基石(一)

接触机器学习有两年了,也做了一些project,但是还是停留在调库、调参等表面东西上,对于机器学习基础方面的东西,仍旧很虚。

趁着放长假,我决定好好补补基础,然后写写笔记激励自己持续学习。课程是台大林轩田老师的《机器学习基石》这门课,在B站上搜索就能看到。

Lecture 1 The Learning Problem

1.1 What is Machine Learning 什么是机器学习?

这里林老师和人类的学习做了类比,他说人类是通过观察,得到经验模式,再把模式套到新的事物上;机器学习也是一样的。只不过机器是从很多的data中得到经验技巧,再利用得到的经验技巧解决未知的问题。

机器学习适用于这样的场景:

  • 当人类不能手动地构建一个系统或者简单地定义一个“解决方法”时
  • 当需要快速的决策,但是人类的决策速度无法实现时
  • 当需要为数量很多的用户进行用户精准的服务时

也就是说,有些场景过于复杂(人类无法准确地定义),但是这些场景又有一些规律可循;有些场景太过庞大,人脑的计算力不够时,比较适用于机器学习。

1.2 Application Of Machine Learning 机器学习的应用

应用就多啦,这部分没啥笔记可记。

【这里说一下,以前在 KDDCUP 总是看到国立台大的影子,当时还觉得有点纳闷儿,不过有这么厉害的老师和学生,能拿到这些奖是很正常了】

1.3 Components Of Learning 学习的构件

这部分主要是介绍一个机器学习问题的基本构成。

首先,要有输入INPUT,一般称为

然后有输入对应的输出 OUTPUT ,称为 y

我们还需要一个理想化的目标函数使得x和y对应起来,这里将目标函数称为f

 

因为函数f是理想化的,而实际上,我们机器学习的都是近似的模式,或者说,是一种假说 hypothesis,所以我们称机器学习学到的函数为g

我们还有一个 D ,即Data,代表我们训练所需的数据样本

机器学习训练的目标是,让 越来越接近 

1.4 Machine Learning and Other Fields 机器学习和其它领域

1.4.1 ML & Data Mining 机器学习和数据挖掘

林老师将data mining翻译成资料探勘,我们一般翻译成数据挖掘。

数据挖掘:从很大很大量的数据中挖掘出有用的信息。

机器学习:使用数据去找到逼近 f 的假说 g

 

1.4.2 ML & Artificial Intelligence 机器学习和人工智能

机器学习是实现人工智能的一种方式。

 

1.4.3 ML & Statistics 机器学习和统计

统计可以用来实现机器学习。

 

 

 

 

 

 

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值