概率论与贝叶斯先验

前言:
复习概率相关知识,很多不太明白,还需要不断丰富

一、统计数学的概率

  • 给定某正整数N,统计从1到N!的所有数种,首位数字出现1的概率。
  • 进而,可以计算首位数字使2的概率,是3的概率……
import matplotlib.pyplot as plt


def first_digital(x):
    while x >= 10:
        x //= 10
    return x

n = 1
frequency = [0] * 9
for i in range(1, 1000):
    n *= i
    m = first_digital(n) -1
    frequency[m] += 1

print(frequency)
plt.plot(frequency, 'r-', linewidth=2)
plt.plot(frequency, 'go', markersize=8)
plt.show()
  • 100阶结果
    100阶乘

  • 1000阶结果
    1000阶乘

  • 10000阶
    在这里插入图片描述

本福特定律

本福特定律又称第一数学定律,是指在实际生活得出一组数据中以1为首位数字出现的概率约为总数的三成;是直观想象1/9的三倍
- 阶乘/素数数列/斐波那契数数列首位
- 住在地址号码
- 经济数据反欺诈
- 选举投票反欺诈

在这里插入图片描述

二、现实中的概率应用:商品推荐

  • 商品推荐场景中过于聚焦商品推荐往往会损害用户的购物体验,在有些场景中,系统会通过一定成都的随机性给用户带来发现的惊喜感。
  • 假设在某拣场景中,经计算A和B俩个商品与当前访问用户的匹配度都分别为0.8和0.2分,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个均匀分布于0到0.2的最终得分,试计算最终B的分数大于A的分数的概率。

可以通过下图面积关系直观的看出B大于A的概率
在这里插入图片描述

三、概率公式

在这里插入图片描述

  • 条件概率: P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(AB)=P(B)P(AB)
  • 全概率公式: P ( A ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A)=\sum_{i}P(A|B_i)P(B_i) P(A)=iP(ABi)P(Bi)
  • 贝叶斯(Bayes)公式: P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ j P ( A ∣ B j ) P ( B j ) P(B_i|A)=\frac{P(A|B_i)P(B_i)}{\sum_{j}P(A|B_j)P(B_j)} P(BiA)=jP(ABj)P(Bj)P(ABi)P(Bi)

思考题

在这里插入图片描述
整理题设条件及问题:
在这里插入图片描述
通过贝叶斯公式:
在这里插入图片描述

贝叶斯公式 P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)

  • 给定某系统的肉感样本x,计算该系统的参数,即: P ( θ ∣ x ) = P ( x ∣ θ ) P ( θ ) P ( x ) P(\theta|x)=\frac{P(x|\theta)P(\theta)}{P(x)} P(θx)=P(x)P(xθ)P(θ)

    • P ( θ ) P(\theta) P(θ):没有数据支持下,θ发生的概率:先验概率
    • P ( θ ∣ x ) P(\theta|x) P(θx):在数据x的支持下,θ发生的概率:后视概率。
    • P ( x ∣ θ ) P(x|\theta) P(xθ):给定某参数θ的概率分布:似然函数
  • 例如:

    • 在没有任何信息的前提下,猜测某人姓氏:先猜张王李刘……猜对的概率相对较大:先验概率
    • 若知道某人来自”牛家村“,则他姓牛的概率很大:后验概率

四、分布

在这里插入图片描述

两点分布

  • 0 - 1 分布
    在这里插入图片描述

二项分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

考察Taylor展开式

在这里插入图片描述
两边同除以 e x e^x ex
在这里插入图片描述

泊松分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

均匀分布

在这里插入图片描述

指数分布

在这里插入图片描述
在这里插入图片描述
指数分布的无记忆性
在这里插入图片描述

正态分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述

Beta分布

在这里插入图片描述
Beta分布期望
在这里插入图片描述
在这里插入图片描述
Beta分布
在这里插入图片描述

五、指数族

在这里插入图片描述

二项分布和高斯分布指数族

在这里插入图片描述

Bernoulli分布属于指数族

在这里插入图片描述

考察参数

在这里插入图片描述

Sigmoid/Logistic函数

在这里插入图片描述

Sigmoid函数的导数 f ( x ) = 1 1 + e ( − x ) f(x)=\frac{1}{1+e^(-x)} f(x)=1+e(x)1

在这里插入图片描述

Gaussian分布也属于指数族分布

在这里插入图片描述
在这里插入图片描述

六、事件的独立性

在这里插入图片描述

期望

在这里插入图片描述

期望的性质

在这里插入图片描述

例1:计算期望

在这里插入图片描述
计算每一位的期望
在这里插入图片描述
总期望
在这里插入图片描述

例2:集合Hash的问题

在这里插入图片描述

  • 问题分析
    在这里插入图片描述
    在这里插入图片描述

方差

在这里插入图片描述

协方差

在这里插入图片描述

  • 协方差和独立、不相关
    在这里插入图片描述
  • 协方差的意义
    在这里插入图片描述
  • 协方差的上界
    在这里插入图片描述
  • 协方差的上界证明
    在这里插入图片描述
    在这里插入图片描述

Pearson相关系数

在这里插入图片描述
在这里插入图片描述

协方差矩阵

在这里插入图片描述

  • 思考在这里插入图片描述
    在这里插入图片描述
  • 解 以联系型随机变量为例
    在这里插入图片描述

七、切比雪夫不等式

在这里插入图片描述

大数定律

在这里插入图片描述

大数定律的意义

在这里插入图片描述

  • 思考?
    在这里插入图片描述

重要推论

在这里插入图片描述

八、伯努利定理

在这里插入图片描述

九、中心极限定理

在这里插入图片描述

例:标准的中心极限定理问题

在这里插入图片描述


  • 在这里插入图片描述

中心极限定理的意义

在这里插入图片描述

十、贝叶斯公式带来的思考

P ( A ∣ D ) = P ( D ∣ A ) P ( A ) P ( D ) P(A|D)=\frac{P(D|A)P(A)}{P(D)} P(AD)=P(D)P(DA)P(A)
在这里插入图片描述

十一、最大似然估计

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值