本文来自作者 止斋少主 在 GitChat 上分享「机器学习入门第一课:从高中课本谈起」,「阅读原文」查看交流实录
「文末高能」
编辑 | 嘉仔
高中课本那些事
点连成线
上小学的时候,我们学过平面内,任意两点之间可以连成一条直线,且只能连成一条直线。
上初中的时候,我们学过y=kx+b已知两点求过这两点A、B直线方程。
这道题很简单,二元一次方程组秒杀。
尽可能多的点在一条直线上
上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如何让尽可能多的点连在一条线上
这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如果平面内有点可用如下表达式来刻画这些点与直线 y=kx+b 的接近程度:
使得上式达到最小值的直线 y=kx+b 就是老师让我们求解的直线,老师说这种方法叫最小二乘法。
最后可以求解出
高中老师没说过的那些事
点在面上
上初中的时候,我们学会了三点可以确定一个平面。
尽可能多的点在同一面上
上高中的时候,我们牛逼闪闪的高中老师,给我们出了一道牛逼闪闪的题,平面内一堆点,找出一条直线,使得尽可能的多的点在这条直线上。
两点之间确定一条直线,这若干点,怎能搞,实在不会,老师教了我们一招绝技。
如何让尽可能多的点连在一条线上
如果空间内有点,可用如下表达式来刻画这些点与平面z=ax+by+c(c为常数)的接近程度:使得上式达到最小值的平面z=ax+by+c,就是这道题的答案
数学到算法模型转化的步骤与工具
猜
用数学这把锋利的刀来求解未知问题,做到大胆猜想,往往就可以解决问题,从数学到算法模型转化过程中,猜的作用很大。
独立同分布
-
独立
独立,顾名思义就是事件和事件之间相互不产生影响和作用,比如火星是行星和我是算法工程师之间就是独立的事件,没有相互影响或者彼此之间的作用。
假设事件A1、A2......An的概率分别为P1、P2......Pn,这些独立事件同时发生的概率为:
-
同分布
同分布指的是事件之间,事件的分布是等同的,一致的。
独立同分布意味着事件独立且分布一致。
数据分布
在算法模型转化过程中,数据分布很重要,在某一派别中认为应该是假设数据分布(也就是猜出数据分布),然后进行算法模型转化。
每一种数据分布,都有一种对应的概率。
推
先假设数据的分布,然后根据数据分布对应的概率来推导出需要求解的公式。
似然函数
似然函数,这个东西名字上来看上去绕来绕去,简而言之,就是求解参数。例如高中求解的k、b,大学解得a、b、c。
工具
极大似然估计
极大似然估计,就是求似然函数的极大值点。
实操 线性回归模型
猜
平面内的点,一般满足正态分布,我们来猜这些点满足正态分布,而且是独立同分布的。
正态分布的数据满足,概率:
推
假设事件A1、A2......An的概率分别为P1、P2......Pn这些独立事件同时发生的概率为:
这些点在尽可能在同一平面上的概率:
看,这就是高中到大学的最小二乘法。
机器学习中的那些事 —— 以线性回归举例
任何问题都是有目的的
任何问题都是有目的的,线性回归 y=kx+b 就是目的,我们管这样的函数叫目标函数。
逼近正确就是让失败的情况最差
让失败的情况最差,当失败的情况无限接近最差的时候,就是逼近最正确的时候。最小二乘法就是让失败的情况逼近最差,也就是逼近正确。我们管最小二乘法这样函数叫损失函数,损失函数最小我们叫经验结构最小。
[help me with MathJax]
近期热文
GitChat 与 CSDN 联合推出
《GitChat 达人课:AI 工程师职业指南》
「阅读原文」看交流实录,你想知道的都在这里