Chapter-3_概率分布
本文内容摘自:
https://seeing-theory.brown.edu/probability-distributions/cn.html
概率分布描述了随机变量取值的规律。
1. 随机变量
随机变量是一个函数,它用数字来表示一个可能出现的事件。你可以定义你自己的随机变量,然后生成一些样本来观察它的经验分布。
点击或拉动选中右图中的一些六边形,然后在框中输入一个数字,点击提交,
生成你定义的随机变量的样本,观察相应的经验分布。
实验结果:
2. 离散型和连续型随机变量
常见的随机变量类型有两种:离散型和连续型随机变量
2.1 离散型随机变量
一个离散型随机变量可能的取值范围只有有限个或可列个值。离散型随机变量的定义是:如果X是一个随机变量,存在非负函数f(x)和F(X),使得
P
(
X
=
x
)
=
f
(
x
)
P
(
X
<
x
)
=
F
(
x
)
P(X=x) = f(x) \\ P(X < x) = F(x)
P(X=x)=f(x)P(X<x)=F(x)
则称X是一个离散型随机变量。
选择下方离散型随机变量,右图会出现它的概率质量函数 f(x)(黄色)和分布函数F(x)(橙色)。调整滑块来改变分布函数。
2.1.1 伯努利分布
如果一个随机变量X只取值0或1,概率分布是
P
(
X
=
1
)
=
p
,
P
(
X
=
0
)
=
1
−
p
P(X=1)=p,\quad P(X=0)=1-p
P(X=1)=p,P(X=0)=1−p
则称X符合伯努利分布(Bernoulli)。我们常用伯努利分布来模拟只有两种结果的试验,如抛硬币。
2.2 连续型随机变量
连续型随机变量可能取值的范围是一个无限不可数集合(如全体实数)。连续型随机变量的定义是:设X为随机变量,存在非负函数f(x)使得:
P
(
a
≤
X
≤
b
)
=
∫
a
b
f
(
x
)
d
x
P
(
X
<
x
)
=
F
(
x
)
P(a\leq X\leq b) =\int^b_a f(x) dx \\ P(X< x) = F(x)
P(a≤X≤b)=∫abf(x)dxP(X<x)=F(x)
下面我们提供了一些常见的连续型随机变量,选择其中一个类型,右图会出现它的概率密度函数 f(x)(黄色)和分布函数 F(x)(橙色)。
2.2.1. 正太(Normal)分布
正态分布(也称高斯分布)的密度函数是一个钟形曲线。科学中常用正态分布来模拟许多小效应的叠加。比方说,我们知道人的身高是许多微小的基因和环境效应的叠加。因此可以用正态分布来表示人的身高,
2.2.2. Beta 分布
Beta分布是一族在[0,1]上的连续型概率分布,常用于贝叶斯统计中的共轭先验分布。
3. 中心极限定理
中心极限定理告诉我们,对于一个(性质比较好的)分布,如果我们有足够大的独立同分布的样本,其样本均值会(近似地)呈正态分布。样本数量越大,其分布与正态越接近。
你可以通过调节参数α和β来改变概率分布。
选择每组样本大小和抽取次数(样本均值的个数),然后点击“生成样本”。