1. 数学期望
1.1 定义
数学期望就是 加权平均!!离散型随机变量的数学期望很简单,就是各个可能的值乘以相应的概率。而连续性数学期望也是。其中的x为可能的取值,f(x)就是对应的密度函数,也就是概率。还是“可能值✖概率”。值得一提的是,表示一个“加和”的过程,因为你要考虑期望肯定是对全部数据而言,所以要进行一个加和。
1.2 随机变量函数的数学期望
通常考虑的是一维变量和二维变量。
对于一维变量而言:设一个函数g(x)作用于它,数学期望=加权平均=可能的值✖相应的概率。所以这里的可能取值就变为了g(x)了,而概率却没有发生变化。离散型的为:.
连续型则为:。表示一个“加和”的过程,因为你要考虑期望肯定是对全部数据而言,所以要进行一个加和。
二维变量就是:。我认为难以理解的在于为什么是二重积分,我想仍然是因为 表示一个“加和”的过程,因为你要考虑期望肯定是对全部数据而言,所以要进行一个加和。
如果给了(x,y)的分布律,怎么求g(x)的数学期望呢?思路还是一样的,数学期望=加权平均=可能的值✖相应的概率。。这里的f(x)是x的边缘分布函数,表示相应的x的概率!结合到我们的边缘密度函数定义,我们得到最终结果:。一定要弄明白为什么这里是对x一个变量作用的数学期望却依然要两个积分号!
1.3 数学期望的性质
对于随机变量的数字特征,我的评价是:能用性质用性质!数学期望主要有以下几个性质:
- E(aX+b) =aE(x) + b.
- E(aX+bY) = aE(X) + bE(Y).
- 当X,Y独立时,E(XY)=EX·EY.
仅对第三个性质说明如下:
2. 方差
方差定义为数据的离散程度,所以是和数学期望联系在一起的。定义为:,可见其实还是在求数学期望,那么利用刚才的数学期望的性质展开我们可以得到:.
需要注意的是,原始定义一般是用于证明或者正态分布相关的,因为正态分布存在一个x-μ,而EX=μ,所以两个相互抵消就简单些,对于一般的函数,常常采用下面化简以后的形式。
方差也有一些性质:
- ,当xy独立时,D(X+Y)=DX+DY
3. 相关系数
由上一行知,当xy独立时,E[(X-EX)(Y-EY)]=0.这个就可以描述两个变量的相关程度,定义为协方差:cov(x,y)。同样,能用性质用性质,协方差的一些性质如下:
但是,在进行数据分析的时候,我们要尽量排除量纲的影响,为此我们引入标准协方差,也叫相关系数。.
显然:
标准协方差后者相关系数定义如下:
总结,能用性质先用性质,未完待续...