概率论与数理统计学习：随机变量（三）——知识总结与C语言实现案例

0202ohh

于 2022-09-30 20:49:29 发布

阅读量967

点赞数 2

分类专栏：概率论与数理统计学习文章标签：概率论学习 c语言

本文链接：https://blog.csdn.net/weixin_62917800/article/details/127088889

版权

概率论与数理统计学习专栏收录该内容

11 篇文章 2 订阅

订阅专栏

hello，大家好

这里是第五期概率论与数理统计的学习，我将用这篇博客去整理知识点以及用C语言去实现做题的过程。
在这里插入图片描述

注：关于用C语言实现做题的过程，这里不是去设计一个数学公式去做题，而是像平时写作业那样，先用书上的知识点去完成一个题目，然后再用C语言去得到题目的答案，过程可以有千千万万，只要能实现自己的想法就好。

下面开始知识点的总结。

💦 随机变量函数的分布

随机变量的分布函数…等等
在这里插入图片描述
我们应该总结的是随机变量函数的分布吧？这两个咋这么像呢？

分布函数和函数分布之间有啥关系，又有啥区别呢？

先回顾一下随机变量的分布函数是个啥：

🌱 ：随机变量的分布函数

最开始，对于离散型随机变量，我们是用分布律来刻画它的概率分布情况；对于连续型随机变量，我们是用概率密度来刻画它的概率分布情况。那么讲到这里也就大致明白分布函数是来干啥的了。没错！就是用来刻画离散型和连续型它俩的概率分布情况。

设 $X$ 是一随机变量（离散型和连续型都适用），称函数 $F(x)=P\{X\leq x\},-\infty<x<\infty$
为 $X$ 的分布函数。关于它的具体性质可以点击分布函数

🌱 随机变量函数的分布

在一些试验中，我们所关心的量往往不能通过直接观测来得到，而它恰恰是某个能直接观测到的随机变量的已知函数。例如，我们能直接测量到一个圆的直径 $D$ ，而所关心的却是该圆的面积 $S=(\frac{D}{2})^2\pi$ 。那么，随机变量 $S$ 就是随机变量 $D$ 的函数。也就是我们已知随机变量 $D$ 的分布函数，来求函数 $S = g (D)$ 的分布。

总结：分布函数就是求随机变量 $X$ 的分布函数，函数的分布呢就是求另一个随机变量 $Y$ 的分布函数，而 $Y$ 是关于 $X$ 的函数。

怎么样，对这的理解有没有更深刻了一些？

☁️ 离散型随机变量函数的分布

🌱 定义：设离散型随机变量 $X$ 的概率分布为 $P\{X=x_{k}\}=p_{k},k=1,2,...$ ， $g (x)$ 是一个已知的单值函数，令 $Y = g (X)$ ，则 $Y$ 也是一个离散型随机变量。

例如：

设随机变量 $X$ 有如下的概率分布

$X$	-1	0	1	2
$p_{k}$	0.2	0.3	0.1	0.4

求随机变量 $Y=(X-1)^2$ 的概率分布：

首先 $Y$ 的可能取得值为0，1，4。那么
$P\{Y=0\}=P\{X=1\}=0.1$
$P\{Y=1\}=P\{X=0\}+P\{X=2\}=0.7$
$P\{Y=4\}=P\{X=-1\}=0.2$

可以得到 $Y$ 得概率分布为：

Y	0	1	4
$q_{i}$	0.1	0.7	0.2

☁️ 连续型随机变量函数的分布

对于连续型随机变量 $X$ ，我们先给出一个具体例子，再总结求 $Y = g (X)$ 的基本方法：

🌱 例子：设随机变量 $X$ ~ $N(0,1),Y=e^x$ ，求 $Y$ 的概率密度函数

设 $F (y), f (y)$ 分别为随机变量 $Y$ 的分布函数和概率密度函数

当 $y\leq 0$ 时，有 $F(y)=P\{Y\leq y\}=P\{e^X\leq y\}=P\{\varnothing\}=0$
当 $y > 0$ 时，因为 $g(x)=e^x$ 是 $x$ 的严格单调递增函数，有： $F(y)=P\{Y\leq y\}=P\{e^X\leq y\}=P\{X\leq lny\}=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{lny}e^{-\frac{x^2}{2}}dx$
然后由 $f(y)=F^{'}(y)$ ，可以得到 $f(y)=\begin{cases} \frac{1}{\sqrt{2\pi}y}e^{-\frac{(lny)^2}{2}},y >0\\ 0~~~~~~~~~~~~~~~~~~,y\leq 0\\ \end{cases}$

总结：就是先将 $Y$ 转换成关于 $X$ 的函数，然后所求的就是 $X$ 的分布函数，最后再对这个函数求导即可求出 $Y$ 的概率密度函数。

提问：在这里插入图片描述
为啥直接就 $f(y)=F^{'}(y)$ 啦？发生了甚么？？？

这里就要从连续型随机变量的概率密度函数说起了。

总所周知， $P\{a<X\leq b\}=\int_a^bf(x)dx$ 中 $f (x)$ 就是连续型随机变量的概率密度函数。

而分布函数中， $F(X)=P\{X\leq x\}=\int_{-\infty}^xf(x)dx$ ，这时， $F^{'}(X)=f(x)$ 。

如果你还要问为啥，可能是表述能力不太行，也可能是你没学过高数的原因
在这里插入图片描述
等等哈，上面的描述都是针对于连续型随机变量的，千万别搞错了哟！

☀️ 定理

若随机变量 $X$ 有概率密度函数 $f(x),x\in(-\infty,+\infty),y=g(x)$ 为严格单调函数，且 $g^{'}(x)$ 对一切 $x$ 都存在，记 $(a, b)$ 为 $g (x)$ 的值域， $x = h (y)$ 为 $y = g (x)$ 的反函数，则随机变量 $Y = g (X)$ 的概率密度函数为 $f(y)=\begin{cases} f[h(y)][h^{'}(y)],a<y<b\\ 0~~~~~~~~~~~~~~~~~~~~~,其它 \end{cases}$

上面这个呢，只是比较官方的解释，自己能理解上面示例的过程即可，不用太纠结。
在这里插入图片描述知识总结到这里就结束啦~~下面就开始用做题并用C语言实现过程了喔。

💦 C语言实现具体案例

首先呢，就拿最开始那个简单的离散型随机变量函数分布的例子来用C语言实现！好久没用结构体了，整点骚的，直接上代码：

#include <stdio.h>
#include <math.h>

typedef struct
{
	// var denotes the value of the variate ——var表示随机变量的值
	int var;
	// p denotes the probability of the variate ——p表示该值下的随机变量的概率
	float p;
}Variate;


int main()
{
	// use an array of structure to store the variate and its possbilities ——用结构体数组来存储随机变量和它的概率
	Variate X[4];
	printf("Please input the values of X and its possibilities:\n");
	for(int i = 0 ; i < 4 ; i++)
	{
		scanf("%d,%f",&X[i].var,&X[i].p);
	}
	printf("The end of inputting\n");
	for(int i = 0 ; i < 4 ; i++)
	{
		printf("X = %d,p = %.1f\n",X[i].var,X[i].p);
	}
	// the same as below ——与上面那个结构体数组一样
	Variate Y[3];
	// put the values of Y first ——先将Y可能的值表示出来
	printf("The values of Y maybe :");
	for(int i = 0 ; i < 4 ; i++)
	{
		printf("%.f ",pow(X[i].var - 1,2));
	}
	printf("\n");
	// then you need to select the values that do not duplicate ——然后选出不重复的值
	// you'd better order its values from smallest to largest ——最好是将它的值按从小到大的顺序输入
	printf("Please fill in Y:");
	for(int i = 0 ; i < 3 ; i++)
	{
		scanf("%d",&Y[i].var);
		// for adding up the probabilities in the following steps ——这一步为了下面将有重复值的变量的概率相加
		Y[i].p = 0;
	}
	printf("The end of filling\n");
	for(int i = 0 ; i < 3 ; i++)
	{
		int j = 0;
		while(j < 4)
		{
			if(Y[i].var == pow(X[j].var - 1,2))
				Y[i].p += X[j].p;
			j++;
		}
	}
	printf("\n");
	for(int i = 0 ; i < 3 ; i++)
	{
		printf("Y = %d,p = %.1f\n",Y[i].var,Y[i].p);
	}
	return 0;
}

在这里插入图片描述
离散型随机变量函数的分布做了一个，下面就来一个连续型随机变量的题

设随机变量 $X$ 有概率密度函数 $f(x)=\begin{cases} |x|,-1<x<1\\ 0~~,其它\\ \end{cases}$
求随机变量 $Y = 2 X + 1$ 的概率密度函数。

分析：这个题的思路就跟着上面例题那样就好。 $F(y)=P\{Y\leq y\}=P\{2X+1\leq y\}=P\{X\leq \frac{y-1}{2}\}=P\int_{-\infty}^{\frac{y-1}{2}}f(x)dx$
然后再由定理得出即可。

em…但是由于连续型随机变量总是涉及到求导与积分，个人技术有限，还不能表示出来，不过也在努力中~~~
在这里插入图片描述

设随机变量 $X$ 的分布函数为 $F(x)=\begin{cases} 0~~~~~~~~,x<-1\\ 0.3~~~~~,-1\leq x<1\\ 0.8~~~~~,1\leq x<2\\ 1~~~~~~~~,x\geq 2\\ \end{cases}$
1）求 $X$ 的概率分布
2）求 $Y = ∣ X ∣$ 的概率分布

分析：由上图随机变量 $X$ 的分布函数可知它是一个离散型的随机变量。那么这个题也就好做了，直接上代码👇：

#include <stdio.h>
#include <math.h>
#include <stdlib.h>
typedef struct
{
	int var;
	float p;
}Variate;


int main()
{
	Variate X[3];
	printf("Please input the values of X and its probabilities:\n");
	for(int i = 0 ; i < 3 ; i++)
		scanf("%d,%f",&X[i].var,&X[i].p);
	printf("The end of inputting.\n");
	for(int i = 0 ; i < 3 ; i++)
		printf("X = %d,p = %.1f\n",X[i].var,X[i].p);
	printf("The values of Y maybe :");
	for(int i = 0 ; i < 3 ; i++)
		printf("%d ",abs(X[i].var));
	printf("\n");
	printf("Please select the values that do not duplicate and fill them in Y:\n");
	Variate Y[2];
	for(int i = 0 ; i < 2 ; i++)
	{
		scanf("%d",&Y[i].var);
		Y[i].p = 0;
	}
	printf("The end of filling.\n");
	for(int i = 0 ; i < 2 ; i++)
	{
		int j = 0;
		while(j < 3)
		{
			if(Y[i].var == abs(X[j].var))
				Y[i].p += X[j].p;
			j++;
		}
	}
	printf("The values of Y and its probabilities is :\n");
	for(int i = 0 ; i < 2 ; i++)
		printf("Y = %d,p = %.1f\n",Y[i].var,Y[i].p);
	return 0;
}