概率论与数理统计教程(二)-随机变量及其分布01：随机变量及其分布

u013250861

已于 2024-02-10 23:01:16 修改

阅读量920

点赞数 17

分类专栏：概率论与数理统计文章标签：概率论

于 2024-02-07 21:50:02 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/136074210

版权

为了进行定量的数学处理, 必须把随机现象的结果数量化.
这就是引进随机变量的原因.随机变量概念的引进使得对随机现象的处理更简单与直接,
也更统一而有力.本章我们将主要讨论一维随机变量及其分布.
§ 2.1 随机变量及其分布
在第一章中我们曾提及随机变量,在那里我们把
"用来表示随机现象结果的变量"称为随机变量, 其中"表示"一词的含义是什么?
这是要进一步探讨的问题.
2.1.1 随机变量的概念
在随机现象中有很多样本点本身就是用数量表示的,
由于样本点出现的随机性,其数量呈现为随机变量, 譬如
- 郑一颗骰子,出现的点数 $X$ 是一个随机变量.
- 每天进人某超市的顾客数 $Y$ , 顾客购买商品的件数 $U$ ,
顾客排队等候付款的时间 $V$ , 这里 $Y, U, V$ 是三个不同的随机变量.
- 电视机的寿命 $T$ 是一个随机变量.
- 测量的误差 $\varepsilon$ 是一个随机变量.
在随机现象中还有不少样本点本身不是数,
这时可根据研究需要设置随机变量,臂如
- 检查一个产品, 只考察其合格与否, 则其样本空间为 $\Omega=\{$ 合格品,
不合格品 $\}$ .这时可设置一个随机变量 $X$ 如下:

合格品    $\longrightarrow$

不合格品 $\longrightarrow$
点 0
的取值

在此 $X$ 就是 “检查一个产品中不合格品数”, 它仅可能取值 0 与 1.
若此种产品的不合格品率为 $p$ , 则 $X$ 取各种值及其概率可列表如下:
$X$ 0 1

$P$ $1 - p$ $p$
- 检查三个产品, 则有 8 个样本点, 若记 $X$ 为 “三个产品中的不合格品数”,
则 $X$ 的取值与样本点之间有如下对应关系:
样本点 $X$ 的取值

$\omega_{1}=(0,0,0)$ $\longrightarrow$ 0
$\omega_{2}=(1,0,0)$ $\longrightarrow$ 1
$\omega_{3}=(0,1,0)$ $\longrightarrow$ 1
$\omega_{4}=(0,0,1)$ $\longrightarrow$ 1
$\omega_{5}=(0,1,1)$ $\longrightarrow$ 2
$\omega_{6}=(1,0,1)$ $\longrightarrow$ 2
$\omega_{9}=(1,1,0)$ $\longrightarrow$ 2
$\omega_{8}=(1,1,1)$ $\longrightarrow$ 3
这样 $X$ 取各种值就是如下的互不相容的事件:
$\begin{array}{ll} \{X=0\}=\left\{\omega_{1}\right\}, & \{X=1\}=\left\{\omega_{2}, \omega_{3}, \omega_{4}\right\}, \\ \{X=2\}=\left\{\omega_{5}, \omega_{6}, \omega_{7}\right\}, & \{X=3\}=\left\{\omega_{8}\right\} . \end{array}$

若此种产品的不合格品率为 $p$ , 则 $X$ 取各种值的概率可列表如下:
$X$ 0 1 2 3

$P$ $1-p)^{3}$ $3 p(1-p)^{2}$ $3 p^{2}(1-p)$ $p^{3}$
下面我们给出随机变量的一般定义.
定义 2.1.1 定义在样本空间 $\Omega$ 上的实值函数 $X=X(\omega)$
称为随机变量, 常用大写字母 $X, Y, Z$ 等表示随机变量, 其取值用小写字母
$x, y, z$ 等表示.
假如一个随机变量仅可能取有限个或可列个值, 则称其为离散随机变量.
假如一个随机变量的可能取值充满数轴上的一个区间 $(a, b)$ ,
则称其为连续随机变量, 其中 $a$ 可以是 $-\infty, b$ 可以是 $\infty$ .
这个定义表明: 随机变量 $X$ 是样本点 $\omega$ 的一个函数,
这个函数可以是不同样本点对应不同的实数, 也允许多个样本点对应同一个实数.
这个函数的自变量 (样本点) 可以是数, 也可以不是数,但因变量一定是实数.
与微积分中的变量不同, 概率论中的随机变量 $X$ 是一种
“随机取值的变量且伴随一个分布”. 以离散随机变量为例, 我们不仅要知道 $X$
可能取哪些值, 而且还要知道它取这些值的概率各是多少, 这就需要分布的概念.
有没有分布是区分一般变量与随机变量的主要标志.
2.1.2 随机变量的分布函数
随机变量 $X$ 是样本点 $\omega$ 的一个实值函数, 若 $B$
是某些实数组成的集合, 即 $\subset \mathbf{R}$ , $\mathbf{R}$
表示实数集, 则 $\{X \in B\}$ 表示如下的随机事件
$\{\omega: X(\omega) \in B\} \subset \Omega .$
特别, 用等号或不等号把随机变量 $X$ 与某些实数连接起来, 用来表示事件. 如
$\{X \leqslant a\}$ 、 ${X>b\}$ 和 ${a<X<b\}$ 都是随机事件. 具体有
- 记 $X$ 表示掷一颗骰子出现的点数, 则 $X$ 的可能取值为
$\cdots, 6$ . 这是一个离散随机变量. 事件 $A =$ "点数小于等于 3 ",
可以表示为 $A=\{X \leqslant 3\}$ .
- 记 $Y$ 表示一天内到达某商场的顾客数, 则 $Y$ 的可能取值为
$\cdots, n, \cdots$ . 这也是一个离散随机变量. 事件 $B =$ “至少来
1000 位顾客”, 可以表示为 $B=\{Y \geqslant 1000\}$ .
- 记 $T$ 表示某种电器产品的使用寿命, 则 $T$ 的可能取值充满区间
$\infty)$ . 这是一个连续随机变量. 事件 $C =$ “使用寿命在 40000 至
50000 小时之间”, 可以表示为 $C =$
$\{40000 \leqslant T \leqslant 50000\}$ .
为了掌握 $X$ 的统计规律性, 我们只要掌握 $X$ 取各种值的概率. 由于
$\begin{array}{l} \{a<X \leqslant b\}=\{X \leqslant b\}-\{X \leqslant a\}, \\ \{X>c\}=\Omega-\{X \leqslant c\}, \end{array}$

因此只要对任意实数 $x$ , 知道了事件 $\{X \leqslant x\}$ 的概率就够了,
这个概率具有累积特性, 常用 $F$ 表示. 另外这个概率与 $x$ 有关, 不同的
$x$ , 此累积概率的值也不同, 为此记
$\leqslant x),$
于是 $F (x)$ 对所有 $\in(-\infty, \infty)$ 都有定义, 因而 $F (x)$
是定义在 $(-\infty, \infty)$ 上、取值于 $[0$ , $1]$ 的一个函数.
这就是我们下面要引人的分布函数.
定义 2.1.2 设 $X$ 是一个随机变量, 对任意实数 $x$ , 称
$\leqslant x)$
为随机变量 $X$ 的分布函数. 且称 $X$ 服从 $F (x)$ , 记为 $\sim F(x)$ .
有时也可用 $F_{X}(x)$ 以表明是 $X$ 的分布函数 (把 $X$ 写成 $F$ 的下标).
例 2.1.1 向半径为 $r$ 的圆内随机抛一点, 求此点到圆心之距离 $X$
的分布函数 $F (x)$ , 并求 $P\left(X>\frac{2 r}{3}\right)$ .
解事件 " $\leqslant x$ " 表示所抛之点落在半径为
$\leqslant x \leqslant r)$ 的圆内, 故由几何概率知
$\leqslant x)=\frac{\pi x^{2}}{\pi r^{2}}=\left(\frac{x}{r}\right)^{2},$
而当 $x < 0$ 时,有 $F (x) = 0$ ; 当 $x > r$ 时, 有 $F (x) = 1$ .
从而
$P\left(X>\frac{2 r}{3}\right)=1-P\left(X \leqslant \frac{2 r}{3}\right)=1-F\left(\frac{2 r}{3}\right)=1-\left(\frac{2}{3}\right)^{2}=\frac{5}{9} .$
从分布函数的定义可见, 任一随机变量 $X$ (离散的或连续的)
都有一个分布函数.有了分布函数, 就可据此算得与随机变量 $X$
有关事件的概率. 下面先证明分布函数的三个基本性质.
定理 2.1.1 任一分布函数 $F (x)$ 都具有如下三条基本性质:
(1) 单调性 $F (x)$ 是定义在整个实数轴 $(-\infty, \infty)$
上的单调非减函数, 即对任意的 $x_{1}<x_{2}$ , 有
$F\left(x_{1}\right) \leqslant F\left(x_{2}\right)$ .
(2) 有界性对任意的 $x$ , 有 $\leqslant F(x) \leqslant 1$ , 且
$F(-\infty)=\lim \limits_{x \rightarrow-\infty} F(x)=0,$
$F(\infty)=\lim \limits_{x \rightarrow \infty} F(x)=1 .$
(3) 右连续性 $F (x)$ 是 $x$ 的右连续函数, 即对任意的 $x_{0}$ , 有
$\lim \limits_{x \rightarrow x_{0}+0} F(x)=F\left(x_{0}\right),$
即
$F\left(x_{0}+0\right)=F\left(x_{0}\right) .$
证明 (1) 是显然的, 下证 (2). 由于 $F (x)$ 是事件 $\{X \leqslant x\}$
的概率, 所以 $\leqslant$ $\leqslant 1$ . 由 $F (x)$ 的单调性知,
对任意整数 $m$ 和 $n$ , 有
$\lim \limits_{x \rightarrow-\infty} F(x)=\lim \limits_{m \rightarrow-\infty} F(m), \quad \lim \limits_{x \rightarrow \infty} F(x)=\lim \limits_{n \rightarrow \infty} F(n)$
都存在. 又由概率的可列可加性得

最低0.47元/天解锁文章

u013250861

关注

17
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
概率论与数理统计教程(二)-随机变量及其分布01：随机变量及其分布

为了进行定量的数学处理, 必须把随机现象的结果数量化.这就是引进随机变量的原因.随机变量概念的引进使得对随机现象的处理更简单与直接,也更统一而有力.本章我们将主要讨论一维随机变量及其分布.§ 2.1 随机变量及其分布在第一章中我们曾提及随机变量,在那里我们把"用来表示随机现象结果的变量"称为随机变量, 其中"表示"一词的含义是什么?这是要进一步探讨的问题.2.1.1 随机变量的概念在随机现象中有很多样本点本身就是用数量表示的,由于样本点出现的随机性,其数量呈现为随机变量, 譬如- 郑一颗
复制链接

扫一扫

专栏目录