20210329研究学习笔记

学习主要内容

1.1 机器学习基石 林轩田 P1-P9

主要介绍了课程是foundation-oriented,这个比较吸引我。今天学习的主要是跟(1)机器学习基础、理论和(2)感知机算法相关的内容。

机器学习基石 林轩田

What’s ML?

从数据中通过计算得到的经验来获取skill进一步提高一些performance measure,比如prediction accuracy。

什么时候可以用/适合用机器学习呢:

  1. 存在某些underlying pattern
  2. 这些pattern没有programmable solution
  3. 有一些与这些pattern有关/相关的data存在
Application of ML

举了6个ML在日常生活中应用的例子:
衣、食、住、行、教育、娱乐
ML is everywhere。

Components of ML
  1. unknown target function: f
  2. training data/examples: D
  3. learning algorithm: A
  4. hypothesis set: H
  5. final hypothesis: g

按照我的理解,ML的过程本身就是一个函数近似的过程,假设training data/example (D)是来自于unknown target function (f),根据我们的任务需要,我们设计一定的learning algorithm (A)从hypothesis set (H)中挑选出一个最好的作为final hypothesis (g)。挑选这个最好的final hypothesis的目标就是使得g尽量等于或约等于f,至少在training data上可以实现。
(有时间这里补张图)

ML and other fields

主要分别对比了ML和以下三个领域的联系和区别:

  1. ML & DM
  2. ML & AI
  3. ML & Stats.
Perceptron

介绍了感知机作为线性二分类器的一些特点
并写出了感知机假设的向量形式

Perceptron Learning Algorithm
  1. 从初始值出发
  2. 对于每一个误分类点,不断纠正在training examples/data上的错误直至没有误分类点出现,输出最后一次迭代的w为g:final hypothesis。

PLA算法可以按顺序从0,1,2一直到N,也可以按random的顺序不断执行直至没有误分类点。

但PLA有一个最重要的问题就是该算法是否收敛,关于PLA的收敛性,首先有一个前提是training set D需要是线性可分的。在D是线性可分的前提下,PLA的收敛性可以得到证明,换句话说,对于一个线性可分的数据集做二分类任务,PLA会在一定步骤内学习到一个solution。
证明思路:
不断迭代的W与f,作为两个向量,在长度变化不大的情况下,如果其内积越来越大,则两个向量越来越接近。所以只需要从以下两个方向证明:

  1. 随着PLA的运行,W在不断迭代更新,此过程中W与f的内积越来越大。
  2. W的长度的增长不快。

这里的证明与《统计学习方法》一书中的证明略有不同,但大致思路是一致的。

此外,PLA的solution可以有无穷个。主要受起始点选择、误分类点迭代顺序选择等的影响。

PLA的其他变种

如果D线性不可分,有没有别的方法?毕竟有一些数据集是根本线性不可分的,如何处理这种问题?
面对这种non-separable的问题,PLA可以简单modify一下变成pocket algorithm,去试图找到分类错误最少的参数组合。

Pocket algorithm try to keep best weights in pocket.
简单来说,如果第t+1次的W比第t次的W犯了更少的错误,我们就用第t+1次的W去迭代参数,直至完成所有的比较。

pocket algorithm每次都需要遍历所有的分类点去比较两个参数组合之间的优劣性决定是否迭代,但PLA每次只针对一个误分类点,所以computation cost上pocket algorithm会高一些。

换句话说,如果D是线性可分的,PLA和pocket理论上最后都会有结果,但PLA更快一些。如果D是线性不可分的,PLA没法做,pocket就能够提供一个alternative solution。

1.2 统计学习方法 李航 第二章

这一章的内容,在我看完林轩田的课程后,半小时就很快看完理解了。唯一有问题的地方是感知机的对偶形式,留来后面再学习。
目前已学习的内容:
感知机模型、感知机学习策略、感知机学习算法的原始形式及其收敛性的证明。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值