一、随机事件
概念
现实生活中,一个动作或一个事情,在一定条件下,所得到的结果是不能预先完全确定的,而只能确定是多种可能结果中的一种,称这种现象为随机事件。我们用 X X X表示,用 p ( X = x i ) p(X=x_i) p(X=xi)表示这个事件出现结果为 x i x_i xi的概率(信念的度量),其中 x i x_i xi为随机变量 X X X出现的若干个结果中的第 i i i个。
条件概率
研究随机事件之间关系时,在已知某些事件 X X X的条件下考虑另一些事件 Y Y Y发生的概率是经常遇到的,即为条件概率 p ( Y ∣ X ) p(Y|X) p(Y∣X)。
P ( Y = y i ∣ X = x i ) = P ( X x i Y y i ) P ( X x i ) P(Y=y_i|X=x_i) = \frac {P(X_{x_i}Y_{y_i})} {P(X_{x_i})} P(Y=yi∣X=xi)=P(Xxi)P(XxiYyi)
二、随机变量
随机变量及其分布
描述随机变量时不仅要说明它能够取哪些值,而且还要关心它取这些值的概率,即为随机变量的分布,分为离散型随机变量和连续性随机变量。
P { X = x k } = p k , k = 1 , 2 , . . . P \{ X =x_k \} =p_k,k=1,2,... P{
X=xk}=pk,k=1,2,...
F ( x ) = P { X < = x } , x ∈ ( − ∞ , + ∞ ) F(x) = P \{ X<=x\} ,x \in (- \infty ,+ \infty) F(x)=P{
X<=x},x∈(−∞,+∞)
随机变量的特征
数学期望
- 离散型:
E ( X ) = ∑ i x i p i E(X) = \sum_{i} {x_ip_i} E(X)=i∑xipi - 连续型
E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X)= \int_{- \infty}^{+ \infty}{xf(x)}dx E(X)=∫−∞+∞xf(x)dx
方差
- 离散型
D ( X ) = E { [ X − E ( X ) ] 2 } D(X) =E\{ [X-E(X)]^2\} D(X)=E{ [X−E(X)]2} - 连续型
D ( X ) = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x D(X) =\int_{- \infty}^{+ \infty}{(x-E(X))^2f(x)}dx D(X)=∫−∞+∞(x−E(X))2f(x)dx
协方差
C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X, Y) = E\{ [X-E(X)] [Y-E(Y)]\} Cov(X,Y)=E{ [X−E(X)][Y−E(Y)]}
- 上面的公式适合离散型和连续型
相关系数(皮尔逊系数)
ρ ( X , Y ) = C o v ( X , Y ) D ( X ) D ( Y ) \rho(X,Y) = \frac{Cov(X,Y)}{\sqrt {D(X)} \sqrt {D(Y)}} ρ(X,Y)=D(X)D(Y)Cov(X,Y)- 衡量两个变量之间的相关程度。相关系数在-1到1之间,小于0表示负相关,大于0表示正相关。绝对值 ∣ ρ ( X , Y ) ∣ |\rho(X,Y)| ∣ρ(X,Y)∣ 表示相关度的大小。越接近1,相关度越大。
三、数理统计
概念
在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 X X X 中随机抽取一部分个体 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn ,称 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 为取自 X X X 的容量为 n n n 的样本(这里的 X 1 X_1 X1是表示第一次随机试验它的取值有 i i i个用 x i x_i xi表示对应的结果,即为观测值)
统计量与抽样
数理统计的任务是采集和处理带有随机影响的数据,或者说收集样本并对之进行加工,对样本的研究推断总体(对总体得出一定的结论),这一过程称为为统计推断。在统计推断中,对样本进行加工整理,实际上就是根据样本计算出一些量,使得这些量能够将所研究问题的信息集中起来。这种根据样本计算出的量就是下面将要定义的统计量,因此,统计量是样本的某种函数
常用的统计量
1. 样本均值
设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 是总体 X X X 的一个简单随机样本,称
X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1} {n} {\sum_{i=1}^{n}X_i} X=n1i=1∑nXi
为样本均值。通常用样本均值来估计总体分布的均值和对有关总体分布均值的假设作检验。
2. 样本方差
设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 是总体 X X X 的一个简单随机样本, X ‾ \overline X X 为样本均值,称
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2 = \frac{1} {n-1} {\sum_{i=1}^{n}(X_i-\overline X)^2} S2=n−11i=1∑n(Xi−X)2
为样本方差。通常用样本方差来估计总体分布的方差和对有关总体分布均值或方差的假设作检验。
3. k k k阶样本原点矩
设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X