机器学习——概率论

       

概率论

事件的关系与运算

条件概率,全概率公式,贝叶斯公式

随机变量的期望,方差

协方差,相关系数,协方差矩阵

概率分布:0-1分布,二项分布,高斯分布

极大似然函数估计

大数定律,伯努利大数定律,中心极限定理


概率密度函数围城面积为1

1、常见分布

在这里插入图片描述在这里插入图片描述

2、条件概率、全概率、贝叶斯

1)定义
在这里插入图片描述
进一步理解贝叶斯公式和后验概率。
在这里插入图片描述

3、协方差、相关系数

1)协方差,相关系数
在这里插入图片描述
2)协方差阵
在这里插入图片描述
3)独立、不相关
独立: P ( X Y ) = P ( X ) P ( Y ) P(XY)=P(X)P(Y) P(XY)=P(X)P(Y)
不相关: C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0

4、切比雪夫不等式、大数定律、中心极限定理

1)切比雪夫不等式
在这里插入图片描述
2)伯努利大数定理
进行n次独立重复试验,事件发生的频率近似于数学期望。
在这里插入图片描述

3) 中心极限定理
参考以前我写的中心极限定理

5、本福特定律

本福特定律说明一堆从实际生活得出的数据中, 以1为首位数字的数的出现概率约为总数的三成 ,接近直觉得出之期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的概率就越低。它可用于检查各种数据是否有造假。

6、Sigmoid函数

f ( x ) = 1 1 + e − x f(x)=\frac{1}{1+e^{-x}} f(x)=1+ex1
f ′ ( x ) = f ( x ) ( 1 − f ( x ) ) f'(x)=f(x)(1-f(x)) f(x)=f(x)(1f(x))

sigmoid函数的实质是一个概率分布函数。

7、最大似然估计

使样本发生概率最大时求取参数 θ \theta θ,叫做极大似然估计。

步骤:

  • 写似然函数(联合概率分布函数), L ( x 1 , x 2 , . . . x n ; θ ) L(x_1,x_2,...x_n;\theta) L(x1,x2,...xn;θ)

  • 求对数

  • 求导,令导数为0,得到似然解

    • 例:高斯分布估计 μ \mu μ δ 2 \delta^2 δ2
  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hellobigorange

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值