CDF是累积分布函数(Cumulative Distribution Function)的缩写,它是概率论和统计学中一个重要的概念。CDF表示一个随机变量小于或等于某个特定值的概率。
定义
对于一个随机变量 X X X,其CDF F ( x ) F(x) F(x) 定义为:
F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(X≤x)
其中,
- F ( x ) F(x) F(x) 是随机变量 X X X 的CDF。
- P ( X ≤ x ) P(X \leq x) P(X≤x) 表示随机变量 X X X 取值小于或等于 x x x 的概率。
特点
- 非递减性:CDF总是随着 x x x 的增加而非递减,因为随着观察值界限的增加,包含的事件数量不会减少。
- 范围:CDF的值域在0到1之间,即 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1。
- 极限性质:随机变量 X X X 的CDF满足 lim x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limx→−∞F(x)=0 和 lim x → ∞ F ( x ) = 1 \lim_{x \to \infty} F(x) = 1 limx→∞F(x)=1。
应用
- 概率计算:CDF可以用来确定随机变量在特定区间内取值的概率。
- 描述分布特性:CDF提供了随机变量分布的完整信息,可以用来描述其统计特性,如中位数、四分位数等。
- 统计分析和建模:在统计分析和概率建模中,CDF是基本工具,用于推断、假设检验和预测。
例子
如果随机变量 X X X 服从标准正态分布,则其CDF F ( x ) F(x) F(x) 表示的是随机变量 X X X 取值小于或等于 x x x 的概率,可以通过正态分布的积分来获得。对于标准正态分布,这个函数是S形的,其在 x = 0 x=0 x=0 处的值约为0.5,这意味着随机变量小于0的概率为50%。