前言:
复习概率相关知识,很多不太明白,还需要不断丰富
文章目录
一、统计数学的概率
- 给定某正整数N,统计从1到N!的所有数种,首位数字出现1的概率。
- 进而,可以计算首位数字使2的概率,是3的概率……
import matplotlib.pyplot as plt
def first_digital(x):
while x >= 10:
x //= 10
return x
n = 1
frequency = [0] * 9
for i in range(1, 1000):
n *= i
m = first_digital(n) -1
frequency[m] += 1
print(frequency)
plt.plot(frequency, 'r-', linewidth=2)
plt.plot(frequency, 'go', markersize=8)
plt.show()
-
100阶结果
-
1000阶结果
-
10000阶
本福特定律
本福特定律又称第一数学定律,是指在实际生活得出一组数据中以1为首位数字出现的概率约为总数的三成;是直观想象1/9的三倍
- 阶乘/素数数列/斐波那契数数列首位
- 住在地址号码
- 经济数据反欺诈
- 选举投票反欺诈
二、现实中的概率应用:商品推荐
- 商品推荐场景中过于聚焦商品推荐往往会损害用户的购物体验,在有些场景中,系统会通过一定成都的随机性给用户带来发现的惊喜感。
- 假设在某拣场景中,经计算A和B俩个商品与当前访问用户的匹配度都分别为0.8和0.2分,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个均匀分布于0到0.2的最终得分,试计算最终B的分数大于A的分数的概率。
可以通过下图面积关系直观的看出B大于A的概率
三、概率公式
- 条件概率: P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
- 全概率公式: P ( A ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A)=\sum_{i}P(A|B_i)P(B_i) P(A)=i∑P(A∣Bi)P(Bi)
- 贝叶斯(Bayes)公式: P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ j P ( A ∣ B j ) P ( B j ) P(B_i|A)=\frac{P(A|B_i)P(B_i)}{\sum_{j}P(A|B_j)P(B_j)} P(Bi∣A)=∑jP(A∣Bj)P(Bj)P(A∣Bi)P(Bi)
思考题
整理题设条件及问题:
通过贝叶斯公式:
贝叶斯公式 P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
-
给定某系统的肉感样本x,计算该系统的参数,即: P ( θ ∣ x ) = P ( x ∣ θ ) P ( θ ) P ( x ) P(\theta|x)=\frac{P(x|\theta)P(\theta)}{P(x)} P(θ∣x)=P(x)P(x∣θ)P(θ)
- P ( θ ) P(\theta) P(θ):没有数据支持下,θ发生的概率:先验概率
- P ( θ ∣ x ) P(\theta|x) P(θ∣x):在数据x的支持下,θ发生的概率:后视概率。
- P ( x ∣ θ ) P(x|\theta) P(x∣θ):给定某参数θ的概率分布:似然函数
-
例如:
- 在没有任何信息的前提下,猜测某人姓氏:先猜张王李刘……猜对的概率相对较大:先验概率
- 若知道某人来自”牛家村“,则他姓牛的概率很大:后验概率
四、分布
两点分布
- 0 - 1 分布
二项分布
考察Taylor展开式
两边同除以
e
x
e^x
ex
泊松分布
均匀分布
指数分布
指数分布的无记忆性
正态分布
总结
Beta分布
Beta分布期望
Beta分布
五、指数族
二项分布和高斯分布指数族
Bernoulli分布属于指数族
考察参数
Sigmoid/Logistic函数
Sigmoid函数的导数 f ( x ) = 1 1 + e ( − x ) f(x)=\frac{1}{1+e^(-x)} f(x)=1+e(−x)1
Gaussian分布也属于指数族分布
六、事件的独立性
期望
期望的性质
例1:计算期望
计算每一位的期望
总期望
例2:集合Hash的问题
- 问题分析
方差
协方差
- 协方差和独立、不相关
- 协方差的意义
- 协方差的上界
- 协方差的上界证明
Pearson相关系数
协方差矩阵
- 思考
- 解 以联系型随机变量为例
七、切比雪夫不等式
大数定律
大数定律的意义
- 思考?
重要推论
八、伯努利定理
九、中心极限定理
例:标准的中心极限定理问题
- 解
中心极限定理的意义
十、贝叶斯公式带来的思考
P
(
A
∣
D
)
=
P
(
D
∣
A
)
P
(
A
)
P
(
D
)
P(A|D)=\frac{P(D|A)P(A)}{P(D)}
P(A∣D)=P(D)P(D∣A)P(A)