概率统计总结

本文详细介绍了概率统计的核心概念,包括随机事件、随机变量、数理统计、描述性统计和常见分布。重点讲解了条件概率、数学期望、方差、偏度与峰度以及假设检验的基本步骤和统计量选择。通过实例解析了二项分布、泊松分布、正态分布等常见概率分布,并探讨了参数估计和方差分析的思想。
摘要由CSDN通过智能技术生成

一、随机事件

概念

现实生活中,一个动作或一个事情,在一定条件下,所得到的结果是不能预先完全确定的,而只能确定是多种可能结果中的一种,称这种现象为随机事件。我们用 X X X表示,用 p ( X = x i ) p(X=x_i) p(X=xi)表示这个事件出现结果为 x i x_i xi的概率(信念的度量),其中 x i x_i xi为随机变量 X X X出现的若干个结果中的第 i i i个。

条件概率

研究随机事件之间关系时,在已知某些事件 X X X的条件下考虑另一些事件 Y Y Y发生的概率是经常遇到的,即为条件概率 p ( Y ∣ X ) p(Y|X) p(YX)
P ( Y = y i ∣ X = x i ) = P ( X x i Y y i ) P ( X x i ) P(Y=y_i|X=x_i) = \frac {P(X_{x_i}Y_{y_i})} {P(X_{x_i})} P(Y=yiX=xi)=P(Xxi)P(XxiYyi)

二、随机变量

随机变量及其分布

描述随机变量时不仅要说明它能够取哪些值,而且还要关心它取这些值的概率,即为随机变量的分布,分为离散型随机变量和连续性随机变量。

P { X = x k } = p k , k = 1 , 2 , . . . P \{ X =x_k \} =p_k,k=1,2,... P{ X=xk}=pk,k=1,2,...
F ( x ) = P { X < = x } , x ∈ ( − ∞ , + ∞ ) F(x) = P \{ X<=x\} ,x \in (- \infty ,+ \infty) F(x)=P{ X<=x},x(,+)

随机变量的特征
数学期望
  • 离散型:
    E ( X ) = ∑ i x i p i E(X) = \sum_{i} {x_ip_i} E(X)=ixipi
  • 连续型
    E ( X ) = ∫ − ∞ + ∞ x f ( x ) d x E(X)= \int_{- \infty}^{+ \infty}{xf(x)}dx E(X)=+xfxdx
方差
  • 离散型
    D ( X ) = E { [ X − E ( X ) ] 2 } D(X) =E\{ [X-E(X)]^2\} DX=E{ [XE(X)]2}
  • 连续型
    D ( X ) = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x D(X) =\int_{- \infty}^{+ \infty}{(x-E(X))^2f(x)}dx DX=+(xE(X))2fxdx
协方差

C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X, Y) = E\{ [X-E(X)] [Y-E(Y)]\} Cov(X,Y)=E{ [XE(X)][YE(Y)]}

  • 上面的公式适合离散型和连续型
相关系数(皮尔逊系数)

ρ ( X , Y ) = C o v ( X , Y ) D ( X ) D ( Y ) \rho(X,Y) = \frac{Cov(X,Y)}{\sqrt {D(X)} \sqrt {D(Y)}} ρX,Y=D(X) D(Y) Cov(XY)- 衡量两个变量之间的相关程度。相关系数在-1到1之间,小于0表示负相关,大于0表示正相关。绝对值 ∣ ρ ( X , Y ) ∣ |\rho(X,Y)| ρX,Y 表示相关度的大小。越接近1,相关度越大。

三、数理统计

概念

在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 X X X 中随机抽取一部分个体 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn ,称 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 为取自 X X X 的容量为 n n n 的样本(这里的 X 1 X_1 X1是表示第一次随机试验它的取值有 i i i个用 x i x_i xi表示对应的结果,即为观测值)

统计量与抽样

数理统计的任务是采集和处理带有随机影响的数据,或者说收集样本并对之进行加工,对样本的研究推断总体(对总体得出一定的结论),这一过程称为为统计推断。在统计推断中,对样本进行加工整理,实际上就是根据样本计算出一些量,使得这些量能够将所研究问题的信息集中起来。这种根据样本计算出的量就是下面将要定义的统计量,因此,统计量是样本的某种函数

常用的统计量
1. 样本均值

X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 是总体 X X X 的一个简单随机样本,称
X ‾ = 1 n ∑ i = 1 n X i \overline X = \frac{1} {n} {\sum_{i=1}^{n}X_i} X=n1i=1nXi
为样本均值。通常用样本均值来估计总体分布的均值和对有关总体分布均值的假设作检验。

2. 样本方差

X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 是总体 X X X 的一个简单随机样本, X ‾ \overline X X 为样本均值,称
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2 = \frac{1} {n-1} {\sum_{i=1}^{n}(X_i-\overline X)^2} S2=n11i=1n(XiX)2
为样本方差。通常用样本方差来估计总体分布的方差和对有关总体分布均值或方差的假设作检验。

3. k k k阶样本原点矩

X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值