面试之-3.0概率质量函数，概率密度函数，概率分布函数

最新推荐文章于 2024-01-14 08:54:47 发布

SusanLovesTech

最新推荐文章于 2024-01-14 08:54:47 发布

阅读量2.7k

点赞数 1

分类专栏：机器学习文章标签：概率密度函数概率质量函数 PDF/PMF/ADF

本文链接：https://blog.csdn.net/weixin_44259490/article/details/90513846

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

背景

在学习集成学习时，周志华老师的西瓜书中出现了 $P (\cdot)$ 和 $P (\cdot ∣ \cdot)$ 分别为概率质量函数，条件概率质量函数，在此进行扩充。

（注：研究一个随机变量，不只要看它能取什么值，更重要的是更重要的是各种取值的概率分布！！！！）

概率函数（分布律）-> 离散型

概率质量函数（Probability Mass Function，PMF）
用函数形式表达概率，如
$Prob = P(X = a_i)(i = 1, 2, 3, 4, 5,6)$
表示X分别为1， 2，3…，6的概率，但是一次只能表示一个随机变量的值

概率分布

概率分布就是将足有可能出现的情况以及情况相对应的概率值全部列出来

概率分布函数（累积分布函数）-> 离散型

累积分布函数 Accumulative Distribution Function（ADF）
设离散型随机变量 $X$ 的分布律是 $P(X=X_k) = p_k(k=1, 2, 3....)$ 则 $F(x)=P(X\leq x) = \sum_{x_k \leq x}p_k$
由于 $F (x)$ 是 $X$ 取 $\leq x$ 的所有 $x_k$ 的概率之和，顾称 $F (x)$ 为累积概率函数或概率分布函数。

概率密度函数和概率密度分布函数 -> 连续型

等价于离散型的概率函数
概率密度函数（Probability Density Function PDF）

定义

密度函数：取一个定点 $x$ ，则按照分布函数的定义，事件 ${x < X < x+h\}$ 的概率 $(h > 0 为常数)$ ，因为 $F (x + h) - F (x)$ ，所以比值 $\frac {F(x+h)-F(x)}{h}$ 可以解释为在 $x$ 附近 $h$ 长的区间 $(x, x + h)$ 内，单位长度所占的概率，另 $\to0$ ，则这个比的极限，即 $F^{'} (x) = f (x)$ ，也就是说 $x$ 点处（无穷小区段内）单位长概率，或者说，它反映了概率在 $x$ 点处的“密集程度”。概率密度函数公式：
$\leq X \leq b) = F(b)-F(a) = \displaystyle\int^b_af(x)dx$
此处的概率就是求面积
在这里插入图片描述
左图是 $F (x)$ 连续型随机变量分布函数，右图为 $f (x)$ 连续型随机变量的概率密度函数，概率密度函数是分布函数的导函数。