概率论知识回顾（十六）：数学期望、中位数的一般化定义

最新推荐文章于 2022-10-31 15:45:33 发布

MengFly_

最新推荐文章于 2022-10-31 15:45:33 发布

阅读量2.9k

点赞数 1

分类专栏：回顾-概率论

本文链接：https://blog.csdn.net/wangpengfei_p/article/details/90734028

版权

回顾-概率论专栏收录该内容

21 篇文章 55 订阅

订阅专栏

概率论知识回顾（十六）

重点：数学期望、中位数的一般化定义

知识回顾用于巩固知识和查漏补缺。知识回顾步骤：

查看知识回顾中的问题，尝试自己解答
自己解答不出来的可以查看下面的知识解答巩固知识。
对知识解答有疑问的，说明有关这一点的知识或者公式没有理解透彻或者没有记住，要重新翻看书籍。

知识回顾

简单概述 $R - S$ 积分。
简单概述数学期望的一般化定义。
简述中位数定义及其优缺点。

知识解答

简单概述 $R - S$ 积分。
- 定义：设 $g (x)$ 是定义在 $(a, b]$ 上的实函数，而 $F^*(x)$ 是定义在实数轴上的单调不减，右连续的实函数。（这个符合分布函数的一些定义）。取分点 $x_0 < x_1 < \cdots < x_n = b$ , 从 $x_{i-1}, x_i)$ 中取一点 $x_{i-1}<\tilde{x}_i < x_i$ , 记 $\sigma = \sum_{i=1}^{n}g(\tilde{x}_i)[F^*(x_i) - F^*(x_{i-1})]$ 。如果有 $\lambda = \max_{1\le i\le n}(x_i - x_{i-1}) \rightarrow 0$ 以及 $\sigma$ 的极限存在，则称此极限为 $g (x)$ 在 $(a, b]$ 上关于函数 $F^*(x)$ 的 $R - S$ 积分。记为 $\int_{a}^{b}g(x)dF^*(x)$
- 当然，当 $\rightarrow -\infty, b \rightarrow+\infty$ 的时候呢， $\sigma$ 的极限存在，就记为 $g (x)$ 在 $(-\infty, +\infty)$ 上关于函数 $F^*(x)$ 的 $R - S$ 积分，记作 $\int_{-\infty}^{+\infty}g(x)dF^*(x)$
- 另一方面,取 $F^*(x) 为 F(x)$ , 假设 $F (x)$ 为分布函数， $f (x)$ 为密度函数，则有 $\int_{a}^{b}g(x)dF(x) = \int_{a}^{b}g(x)f(x)dx$ 。推广到 $-\infty, +\infty$ 上和第二点类似。
- 另外定义在 $(a, b]$ 上的 $R - S$ 积分是不包含 $a$ 点的，这个是需要严格区分的，因为就期望计算来说，由于就离散随机变量来说，在某点的概率不一定为零。
- 性质
  - $\int_{a}^{b}[\alpha g_1(x) + \beta g_2(x)]dF^(x) = \alpha\int_{a}^{b}g_1(x) dF^(x) + \beta\int_{a}^{b} g_2(x)dF^*(x) $
  - $\int_a^b g(x)d[\alpha F_1^*(x) + \beta F_2^*(x)] = \alpha\int_a^bg(x)dF_1^*(x) + \beta \int_a^bg(x)dF_2^*(x)$
  - 当 $g (x) = 1$ 时， $R - S$ 积分为 $\int_a^bdF(x) = P\{a < x \le b\}$
    - 由这一个特性，我们就知道 $P\{X \in D\} = \int_DdF(x)$
    - $P\{(X, Y) \in D\} = \iint_DdF(x, y)$
简单概述数学期望的一般化定义。
- 首先我们来看看数学期望的定义 $\sum_ip_ix_i$ ,由于概率密度并不一定是都存在，而无论是离散随机变量函数连续随机变量 $p_i = F(x_i) - F(x_i - 0)$
- 我们来看看 $R - S$ 积分的形式： $\sigma = \sum_{i=1}^{n}g(\tilde{x}_i)[F^*(x_i) - F^*(x_{i-1})]$ , 当 $\lambda = \max_{1\le i\le n}(x_i - x_{i-1}) \rightarrow 0$ 的时候， $F^*(x_i) - F^*(x_{i-1}) = p_i$ , 而当这里的 $g(\tilde{x}_i) = x_i$ 的时候。就是我们数学期望的公式。
- 因此我们有：假设随机变量 $X$ 的分布函数为 $F (x)$ 如果有 $\int_{-\infty}^{+\infty}|x|dF(x) < +\infty$ 那么就定义 $\int_{-\infty}^{+\infty}xdF(x)$
- 对于随机变量的函数的数学期望，就有 $\int_{-\infty}^{+\infty}ydF_Y(y) = \int_{-\infty}^{+\infty} g(x)dF(x)$
- 同理，对于n维随机变量，则有：如果 $\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}|g(x_1, x_2, \cdots, x_n)|dF(x_1, x_2, \cdots, x_n) < + \infty$ , 则 $Eg(x_1, \cdots, x_n) = \int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}g(x_1, x_2, \cdots, x_n)dF(x_1, x_2, \cdots, x_n)$
简述中位数定义及其优缺点。
- 对于中位数 $x$ 来说，有 $P\{X \le x\} \ge \frac 1 2, P\{X \le x\} \ge \frac 1 2$
- 优点：不受数据中某些特别大或者特别小的值得影响，具有一些代表性
- 缺点：
  - 没有数学期望那样的可计算性的性质，不利于在数学上的处理。只能单独表示某些属性。
  - 中位数可以不唯一，同时也可能是一个无意义的值。