20210329研究学习笔记_final hypothesis-CSDN博客

本文链接：https://blog.csdn.net/Tracy_20191218/article/details/115326490

学习主要内容

1.1 机器学习基石林轩田 P1-P9

主要介绍了课程是foundation-oriented，这个比较吸引我。今天学习的主要是跟(1)机器学习基础、理论和(2)感知机算法相关的内容。

机器学习基石林轩田

What’s ML?

从数据中通过计算得到的经验来获取skill进一步提高一些performance measure，比如prediction accuracy。

什么时候可以用/适合用机器学习呢：

存在某些underlying pattern
这些pattern没有programmable solution
有一些与这些pattern有关/相关的data存在

Application of ML

举了6个ML在日常生活中应用的例子：
衣、食、住、行、教育、娱乐
ML is everywhere。

Components of ML

unknown target function： f
training data/examples： D
learning algorithm： A
hypothesis set： H
final hypothesis： g

按照我的理解，ML的过程本身就是一个函数近似的过程，假设training data/example （D）是来自于unknown target function （f），根据我们的任务需要，我们设计一定的learning algorithm （A）从hypothesis set （H）中挑选出一个最好的作为final hypothesis （g）。挑选这个最好的final hypothesis的目标就是使得g尽量等于或约等于f，至少在training data上可以实现。
（有时间这里补张图）

ML and other fields

主要分别对比了ML和以下三个领域的联系和区别：

ML & DM
ML & AI
ML & Stats.

Perceptron

介绍了感知机作为线性二分类器的一些特点
并写出了感知机假设的向量形式

Perceptron Learning Algorithm

从初始值出发
对于每一个误分类点，不断纠正在training examples/data上的错误直至没有误分类点出现，输出最后一次迭代的w为g：final hypothesis。

PLA算法可以按顺序从0，1，2一直到N，也可以按random的顺序不断执行直至没有误分类点。

但PLA有一个最重要的问题就是该算法是否收敛，关于PLA的收敛性，首先有一个前提是training set D需要是线性可分的。在D是线性可分的前提下，PLA的收敛性可以得到证明，换句话说，对于一个线性可分的数据集做二分类任务，PLA会在一定步骤内学习到一个solution。
证明思路：
不断迭代的W与f，作为两个向量，在长度变化不大的情况下，如果其内积越来越大，则两个向量越来越接近。所以只需要从以下两个方向证明：