台大-机器学习
文章平均质量分 79
该专栏是自己在学习台湾大学《机器学习基石》与《机器学习技法》公开课中的一些笔记,欢迎大家关注讨论。
Eathen_Zheng
这个作者很懒,什么都没留下…
展开
-
《机器学习基石》笔记系列
前言“机器学习基石”是 Coursera 上一门关于机器学习的课程,由国立台湾大学的老师林轩田讲授。该课程一共有16节课,主要介绍了机器学习领域的基础理论知识。授课大纲课程的大纲如下,以下的每个小项目对应到约一小时的课程:When Can Machines Learn? [何时可以使用机器学习] – The Learning Problem [机器学习问题] – Lear...原创 2018-03-24 16:57:42 · 354 阅读 · 0 评论 -
《机器学习基石》9-Linear Regression
这一节主要介绍线性回归算法。Linear Regression Problem对于输出空间 Y=RY=R\mathcal{Y} = \Bbb{R} 的一类问题,一个比较简单的想法就是:将 Linear Classification 的决策函数中的 sign 函数去掉,使用各种特征的加权结果来表示 yyy y≈∑i=0dwixi=wTxy≈∑i=0dwixi=wTxy \approx ...原创 2018-04-03 20:18:51 · 266 阅读 · 0 评论 -
《机器学习基石》8-Noise and Error
这一节主要讨论在有噪声的情况下,VC维理论是否仍适用。Noise and Probabilistic Target回顾之前提到的机器学习的流程图,学习的目的,就是找到一个函数 ggg,使得它与目标函数 fff 差不多。 然而在现实生活中,往往伴随着噪声: 这些噪声的类别是多种多样的noise in yyy:如标签标错了noise in xxx:如原本的数据就存在噪声...原创 2018-04-03 20:16:24 · 269 阅读 · 0 评论 -
《机器学习基石》6-Theory of Generalization
Restriction of Break Point上次我们说到,需要探究 “break point” kkk 与 mH(N)mH(N)m_\mathcal{H}(N) 之间的关系。回顾一下,mH(N)mH(N)m_\mathcal{H}(N) 表示假设空间在 NNN 个样本点上能产生的最大二分数量,kkk 表示不能满足完全分类情形的样本点数。让我们来探讨一下,当 kkk 确定时,mH(N...原创 2018-04-03 20:14:22 · 347 阅读 · 0 评论 -
《机器学习基石》5-Training versus Testing
接着上一篇所讨论的问题,继续讨论。Recap and Preview回顾一下机器学习的流程图: 机器学习可以理解为寻找到 ggg,使得 g≈fg≈fg \approx f,也就是 Eout(g)≈0Eout(g)≈0E_{out}(g) \approx 0 的过程。 为了完成这件事情,有两个关键的步骤:保证 Eout(g)≈Ein(g)Eout(g)≈Ein(g)E_{o...原创 2018-03-24 17:37:02 · 236 阅读 · 0 评论 -
《机器学习基石》4-Feasibility of Learning
在这篇文章中,我们主要探讨,机器到底能不能进行学习这个问题。Learning is Impossible?从前面的文章中,我们已经知道,机器学习的过程,就是通过现有的训练集 DDD 学习,得到预测函数 hhh,并且使得它接近于目标函数 fff。我们必须思考的问题是: 这种预测是可能的么?也就是说,机器能通过学习得到 hhh,使得 h≈fh≈fh \approx f 吗?N...原创 2018-03-24 17:36:38 · 287 阅读 · 0 评论 -
《机器学习基石》3-Types of Learning
这节课主要介绍机器学习问题的一些分类。Learning with Different Output Space YY\mathcal{Y}按照数据的输出,可以把 ML 分为以下几类:二类别分类问题:Y∈{0,1}Y∈{0,1}\mathcal{Y} \in \{0, 1\}多类别分类问题:Y∈{0,1,⋯,K}Y∈{0,1,⋯,K}\mathcal{Y} \in \{0, 1,...原创 2018-03-24 17:35:40 · 194 阅读 · 0 评论 -
《机器学习基石》2-Learning to Answer Yes/No
这节课主要介绍感知器算法(Perceptron Learning Algorithm)。Perceptron Hypothesis Set对于一个线性可分的二分类问题,我们可以采用感知器 (Perceptron)这种假设集。采用这种假设集进行分类的思想是这样的: 我们假设样本的类别是由样本每一个特征 xixi\textbf{x}_i 共同决定,其中不同的特征的重要程度不一样。于是...原创 2018-03-24 17:32:27 · 283 阅读 · 0 评论 -
《机器学习基石》1-The Learning Problem
IntrodctionWhat is Machine Learning机器学习:计算机通过数据和计算获得一定技巧的过程。技巧:指的是在某些事情上表现更加出色,比如预测、识别等等。Why using Machine Learning一些数据或者信息,人来无法获取,可能是一些人无法识别的事物,或是数据信息量特别大;人的处理满足不了需求,比如:定义很多很多的规则满足物体...原创 2018-03-24 17:27:31 · 347 阅读 · 0 评论