# 2021.09.18 点赞过1 明日更新下一P
# 内容:P10,P11
主要参考:https://blog.csdn.net/oldmao_2001/article/details/90314458
高斯分布:https://zhuanlan.zhihu.com/p/262125747
李宏毅老师《机器学习》笔记:4.概率分类模型
【视频链接】
P10: 概率分类模型
10.1 线性回归模型短板
- 不足1: 当我们发现有些数据很离谱,那么会严重影响模型,使得得出我们不想要的结果
右图我们得到的是紫的回归线,很明显 不是最理想的绿色
-
不足2:多分类的时候,错误的估计关系
我们多分类时,有分类1,2,3.线性回归会很自然的认为 3类离2类相似度更近,相对于1类来说。
-
不足3:有些模型你没办法计算
损失函数是输出和标记(label)不同的次数之和,这个函数是无法微分的。学过的梯度下降无法解决这个问题,解决方案有:感知机、支持向量机,但今天会用概率的方式解决这个问题。
10.2 贝叶斯
大名鼎鼎的贝叶斯是啥?很简单。
贝叶斯:拿到一个球是绿球,这个球是C1类拿出的概率是:
其中,全概率公式:
.
说人话就是,取出x的概率(比如绿球的概率)=C1箱中拿个球是绿 x x x球 x 选C1箱的概率 + C2箱中拿个球 x x x是绿球 x 选C2箱的概率
*注 运算符号为黄
10.3 高斯分布
正态分布数学推导过程:
https://zhuanlan.zhihu.com/p/24437232
【引题】
如果你抓了一把沙子,然后将它撒在桌子上,那么,沙子会均匀的铺在桌子上么,不会,沙子会堆成一个小堆,中心沙子最多,离中心越远沙子越少。
如果一个地区的平均工资是6000元,那么,收入2000元和10000元的人将是少数,大部分人的工资会在6000元左右浮动。
我们通常发现,以上问题都有很规律的分布,就是中间概率大,极端概率小的问题。
【单变量高斯分布】
- 高斯分布就是大名鼎鼎的正态分布
- 参数 方差 σ \sigma σ