概率论与数理统计(茆诗松)复习

第一章 随机事件及其概率

概率的公理化定义:
1)非负性公理
2)正则性公理
3)可加性公理

重复组合:从n个不同的元素中每次取出一个,放回后再取出下一个,如此连续取r次所得的组合称为重复组合,总数为C_{n+r-1}^{r}
可结合插板法考虑

概率的加法公式

多个事件的独立性不只是两两独立,eg:三个事件相互独立需要满足4个等式。

条件概率同样满足概率的公理化中的三个条件。

乘法公式

全概率公式(经由另一对全空间的分割,通过乘法公式/条件概率推算得出)

由全概率公式可知,抽签不分先后,机会是均等的。

敏感性问题的调查,可以设置两个问题,其中A为感兴趣的B为不感兴趣的。被调查者从一个罐子中随机抽取一只球,抽到白球则回答A,抽到红球则回答B。通过相关概率公式可以计算感兴趣的问题的概率性质。

贝叶斯公式,可由条件概率公式、乘法公式及全概率公式得出。

第二章 随机变量及其概率分布

分布函数F(x)=P(X<=x)的性质:
1)0<=F(x)<=1
2)在x趋于负无穷时为0
3)在x趋于正无穷时为1
4)F(x)是非降函数
5)右连续函数

泊松分布
是常用对的离散分布之一,eg: 在一定时间内, 电话总站接错电话的次数。其中使用的 λ λ 不同。泊松分布与计数过程相关联,在一定时间或一定区域或一特定单位内的前提下进行。

(泊松定理)
n大p小,且\lambda=np大小合适,二项分布中的概率有一个很好的近似公式,可用泊松分布中相应次数的概率近似二项分布中的概率。(就求极限即可)

人们把一次试验中出现概率很小(如小于0.05)成为稀有事件,此时可使用二项分布的泊松近似。

超几何分布

指数分布 Exp(λ) E x p ( λ )
p(x)=λeλx,x0 p ( x ) = λ e − λ x , x ≥ 0

随机变量函数的分布。 Y=g(X) Y = g ( X )
pY(y)=pX(h(y))|h(y)| p Y ( y ) = p X ( h ( y ) ) | h ′ ( y ) |
其中 x=h(y) x = h ( y ) y=g(x) y = g ( x ) 的反函数.

期望存在的条件是期望对应的积分绝对可积。
期望不一定存在如柯西分布 p(x)=1π(x2+1),<x<+ p ( x ) = 1 π ( x 2 + 1 ) , − ∞ < x < + ∞ 的期望不存在。

正态分布 N(μ,σ) N ( μ , σ )
p(x)=12πσe(xμ)22σ2,<x<+ p ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ ,其中 <μ<+ − ∞ < μ < + ∞ 决定位置, σ>0 σ > 0 决定散布大小。
(从正态分布可以导出一些有用的分布,如统计中常用的三大分布 χ2 χ 2 t t F)
0.95 (-1.96, 1.96)
0.99 (-2.58, 2.58)
0.99 (-3.29, 3.29)

伽马分布 Ga(a,λ) G a ( a , λ )
p(x)=λaΓ(a)xa1eλx,x>0 p ( x ) = λ a Γ ( a ) x a − 1 e − λ x , x > 0
其中 a>0 a > 0 称为形状参数, λ>0 λ > 0 称为尺度参数。
a<1,a=1,a>1 a < 1 , a = 1 , a > 1 时密度函数各不相同, a>1 a > 1 时密度函数具有单峰,另外 1<a2 1 < a ≤ 2 a>2 a > 2 时又有不同。
用于描述产品寿命
注: Γ(1)=1,Γ(n+1)=n!,Γ(12)=π Γ ( 1 ) = 1 , Γ ( n + 1 ) = n ! , Γ ( 1 2 ) = π

1)因此, a=1 a = 1 的伽马分布 Ga(1λ) G a ( 1 , λ ) 是指数分布。可用来描述第一次冲击到来的时间,电话的通话是时间等。具有无记忆性。

2) a=λ=n2 a = λ = n 2 , λ=12 λ = 1 2 的伽马分布 Ga(n212) G a ( n 2 , 1 2 ) 称为自由度为 n n χ2分布

贝塔分布 Be(a,b) B e ( a , b )
p(x)=Γ(a+b)Γ(a)+Γ(b)xa1(1x)b1,0x1 p ( x ) = Γ ( a + b ) Γ ( a ) + Γ ( b ) x a − 1 ( 1 − x ) b − 1 , 0 ≤ x ≤ 1 ,其中 a>0,b>0 a > 0 , b > 0 均为形状参数
β(a,b)=10xa1(1x)b1dx,a>0,b>0 β ( a , b ) = ∫ 0 1 x a − 1 ( 1 − x ) b − 1 d x , a > 0 , b > 0
β(a,b)=Γ(a)+Γ(b)Γ(a+b) β ( a , b ) = Γ ( a ) + Γ ( b ) Γ ( a + b )
a=1,b=1 a = 1 , b = 1 时 Be(1,1) B e ( 1 , 1 ) 即为 U(0,1) U ( 0 , 1 )
期望与方差
E(X) E ( X ) 是分布位置的特征数。
XE(X) X − E ( X ) 偏差
E(XE(X))2 E ( X − E ( X ) ) 2 表征随机变量取值的波动大小
Var(X)=E[XE(X)]2=E(X2)E(X)2 V a r ( X ) = E [ X − E ( X ) ] 2 = E ( X 2 ) − E ( X ) 2
σ(X)=Var(X) σ ( X ) = V a r ( X )
可利用求导、二项式公式、泰勒展开、分部积分
二项分布 B(n,p) B ( n , p )
期望 np n p , 方差 np(1p) n p ( 1 − p )
泊松分布 P(λ) P ( λ )
期望 λ λ , 方差 λ λ
几何分布
期望p^{-1}

均与分布 U(a,b) U ( a , b )
期望 a+b2 a + b 2 , 方差 (ba)212 ( b − a ) 2 12
指数分布 Exp(λ) E x p ( λ )
p(x)=λeλx,x0 p ( x ) = λ e − λ x , x ≥ 0
期望 1λ 1 λ , 方差 1λ2 1 λ 2
正态分布 N(μ,σ) N ( μ , σ )
p(x)=12πσe(xμ)22σ2,<x<+ p ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ ,其中 <μ<+ − ∞ < μ < + ∞ 决定位置, σ>0 σ > 0 决定散布大小。
(从正态分布可以导出一些有用的分布,如统计中常用的三大分布 χ2 χ 2 t t F)
期望 μ μ
方差 σ2 σ 2
伽马分布 Ga(a,λ) G a ( a , λ )
期望 aλ a λ , 方差 aλ2 a λ 2
χ2 χ 2 分布
期望 n n , 方差2n
贝塔分布 Be(a,b) B e ( a , b )
期望 aa+b a a + b

切比雪夫不等式
P(|XE(X)ϵ|Var(X)ϵ) P ( | X − E ( X ) ≥ ϵ | ≤ V a r ( X ) ϵ )


变导系数 Cv=Var(X)EX C v = V a r ( X ) E X
分位数 F(xα)=xαp(x)dx=P(Xα)=α F ( x α ) = ∫ − ∞ x α p ( x ) d x = P ( X ≤ α ) = α , xα x α 称为 X X 分布的α分位数,或 α α 下侧分位数。
众数 Mod(X) M o d ( X ) , P(X=x) P ( X = x ) 达到最大的 x x

第三章 多维随机变量

二维正态分布N(μ1,μ2,σ12,σ12,ρ)
的边缘分布是一维正态分布 N(μ1,σ21) N ( μ 1 , σ 1 2 ) , N(μ2,σ22) N ( μ 2 , σ 2 2 )
由此也可以看出二维联合分布可以唯一决定其每个分量的的边缘分布,但是反过来不成立。

泊松分布,二项分布、正态分布、伽马分布可加性:(独立)
XP(λ1),YP(λ1) X ∼ P ( λ 1 ) , Y ∼ P ( λ 1 ) X X Y独立,则 X+YP(λ1+λ2) X + Y ∼ P ( λ 1 + λ 2 )
XB(n,p),YB(m,p) X ∼ B ( n , p ) , Y ∼ B ( m , p ) X X Y独立,则 X+YB(n+m,p) X + Y ∼ B ( n + m , p )
XN(μ1,σ21),YN(μ2,σ22) X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X X Y独立,则 X+YN(μ1+μ2,σ21+σ21) X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 1 2 )
XΓ(a1,λ),YΓ(a2,λ) X ∼ Γ ( a 1 , λ ) , Y ∼ Γ ( a 2 , λ ) X X Y独立,则 X+YΓ(a1+a2,λ) X + Y ∼ Γ ( a 1 + a 2 , λ )

E(X+Y)=E(X)+E(Y) E ( X + Y ) = E ( X ) + E ( Y )
X X Y独立,则 E(XY)=E(X)E(Y) E ( X Y ) = E ( X ) E ( Y )
X X Y独立,则 Var(X±Y)=Var(X)+Var(Y) V a r ( X ± Y ) = V a r ( X ) + V a r ( Y )

协方差 Cov(X,Y)=E[(XE(X))(YE(Y))]=E(XY)E(X)E(Y) C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E ( X Y ) − E ( X ) E ( Y )
X X Y独立,则 Cov(X,Y)=0 C o v ( X , Y ) = 0 .
Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y) V a r ( X ± Y ) = V a r ( X ) + V a r ( Y ) ± 2 C o v ( X , Y )

(线性)相关系数 Corr(X,Y)=Cov(X,Y)σXσY C o r r ( X , Y ) = C o v ( X , Y ) σ X σ Y
1Corr(X,Y)1 − 1 ≤ C o r r ( X , Y ) ≤ 1
独立则相关系数为0,反之不然。在二维正态分布场合例外。

条件期望 E(E(X|Y))=E(X) E ( E ( X | Y ) ) = E ( X )

中心极限定理(n个相互独立、同分布的随机变量之和的分布近似于正态分布)
{Xn} { X n } 是独立同分布的随机变量序列,其中 E(X1)=μ,Var(X1)=σ2 E ( X 1 ) = μ , V a r ( X 1 ) = σ 2 , 假如方差有限且不为零0,则前 n n 个随机变量之和的标准化变量Yn=X1+...+Xnnμnσ的分布函数收敛于 Φ(y) Φ ( y ) , 即
limn+P(Yny)=Φ(y) lim n → + ∞ P ( Y n ≤ y ) = Φ ( y )

因此 np5,n(1p)5 n p ≥ 5 , n ( 1 − p ) ≥ 5 时可用正态分布近似二项分布。使用正态近似应修正区间为往左右放大 dfrac12 d f r a c 1 2

独立不同分布的随机变量之和也有类似的中心极限定理。

统计量及其分布

从这里开始,我们通过对随机现象的观测或试验来获取数据,通过对数据的分析与推断去寻求隐藏在数据中的统计规律性。

eg:通过样本去推断总体。由于在实际中常常只能得到有限的甚至少量的数据,这部分数据必然带有随机性,我们需要从中尽可能地排出随机性的干扰以做出合理的推断。

常用的抽取样本的方法是“简单随机抽样”,样本具有代表性(同分布),独立性。

经验分布函数,n增大经验分布函数也将在概率移一下越来越靠近总体分布函数。

X=(X1,X2,...,Xn) X = ( X 1 , X 2 , . . . , X n ) 是取自某总体的一个容量为 n n 的样本, 如果
T=T(X)=T(X1,X2,...,Xn)不含任何未知参数,则称 T T 为统计量。统计量的分布称为抽样分布。

样本均值X¯=1ni=1nXi
样本方差 S2n=1ni=1n(XiX¯)2 S n 2 = 1 n ∑ i = 1 n ( X i − X ¯ ) 2
n n 不大时,常用S2=1n1i=1n(XiX¯)2

计算偏差平方和 Q=i=1n(xix¯)2 Q = ∑ i = 1 n ( x i − x ¯ ) 2 的常用公式:
Q=i=1n(xix¯)2=i=1nx2i2i=1nxix¯+i=1nx¯2=i=1nx2inx¯2=i=1nx2i1n(i=1nxi)2 Q = ∑ i = 1 n ( x i − x ¯ ) 2 = ∑ i = 1 n x i 2 − 2 ∑ i = 1 n x i ⋅ x ¯ + ∑ i = 1 n x ¯ 2 = ∑ i = 1 n x i 2 − n x ¯ 2 = ∑ i = 1 n x i 2 − 1 n ( ∑ i = 1 n x i ) 2

X1,X2,...,Xn X 1 , X 2 , . . . , X n 是来自总体 N(μ,σ2) N ( μ , σ 2 ) 的一个样本,则
n1σ2S2=nσ2S2n=1σ2i=1n(XiX¯)2χ2(n1) n − 1 σ 2 S 2 = n σ 2 S n 2 = 1 σ 2 ∑ i = 1 n ( X i − X ¯ ) 2 ∼ χ 2 ( n − 1 ) 且与 X¯ X ¯ 独立

偏度反映了总体分布密度曲线的对称信息。是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。偏度(Skewness)亦称偏态、偏态系数。 SK>0 S K > 0 右偏,正偏,右长尾,也就是说均值右边的数据较多。

峰度(Kurtosis)与偏度类似,反映了总体分布密度曲线的在其峰值附近的陡峭程度的信息。是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。

总体偏度 SK=μ3σ3 S K = μ 3 σ 3 即为标准化变量的三阶矩。
总体峰度 μ4σ43 μ 4 σ 4 − 3

其中 μ3,μ4 μ 3 , μ 4 皆为中心距。

次序统计量的抽样分布
k k 个次序统计量X(k)的概率密度函数是:
pk(x)=n!(k1)!(nk)![F(x)]k1[1F(x)]nkp(x) p k ( x ) = n ! ( k − 1 ) ! ( n − k ) ! [ F ( x ) ] k − 1 [ 1 − F ( x ) ] n − k p ( x )

样本极差表示样本取值范围的大小也反映了总体取值的分散和集中程度。
R=X(n)X(1) R = X ( n ) − X ( 1 )

参数估计

形式有两种: 点估计和区间估计

点估计值能给人们一个明确的数量,未知参数是多少,但是却不能给出精度。

点估计的常用方法有矩法估计和极大似然估计。

矩法估计 用样本矩去估计总体矩

评价估计的好坏,无偏性(渐进五篇)、有效性(无偏时,方差最小)、均方误差准则(有偏时,均方误差最小)、相和性(p收敛,n越大 θ^ θ ^ 应该越来越接近 θ θ

辛钦大数定律独立同分布的随机变量,具有有限数学希望,则样本均值是数学期望的相和估计。

极大似然估计(MLE,总体分布类型已知时

θ θ 的一切取值之中选出一个使样本观测值出现的概率为最大的 θ θ 值(记为)作 θ^ θ ^ θ θ 的估计,并称 θ^ θ ^ θ θ 的极大似然估计.
L(θ)=i=1np(xi;θ) L ( θ ) = ∏ i = 1 n p ( x i ; θ ) ,
L(θ^)=maxL(θ) L ( θ ^ ) = max L ( θ )
可通过求导获得极大似然估计的情况,直接求导(为求导方便,常对似然函数取对数)。不可时,通过定义出发直接求 L(θ) L ( θ ) 的极大值点。

极大似然估计的不变原则, θ^ θ ^ θ θ 的极大似然估计, g(θ) g ( θ ) θ θ 的连续函数, 则
g(θ^) g ( θ ^ ) g(θ) g ( θ ) 的极大似然估计.

极大似然估计具有渐进正态性。

区间估计给出一个区间以及相应的精度。
P(θLθθU)1α P ( θ L ≤ θ ≤ θ U ) ≥ 1 − α , 则称随机区间 [θL,θU] [ θ L , θ U ] θ θ 的置信水平为 1α 1 − α 的置信区间
常用方法枢轴量法(点估计 θ^ θ ^ 通过点估计去寻找)
θ θ 的一个点估计 θ^ θ ^ 出发,构造 θ^ θ ^ θ θ 的一个函数 G(θ^,θ) G ( θ ^ , θ ) ,是的 G G 的分布已知且与θ无关
eg:
正态分布 N(μ,σ2) N ( μ , σ 2 )

1)正态均值
方差 σ2 σ 2 已知,样本数 n n 已知, 将X¯μσ/n作为枢轴量给出均值 μ μ 得到置信区间

2)正态均值
方差 σ2 σ 2 未知,样本数 n n 已知,
X¯μS/n( t(n1)) t ( n − 1 ) ) 作 为 枢 轴 量 给 出 均 值 \mu$得到置信区间。

t t 分布t(n)XN(0,1), Yχ2(n) Y ∼ χ 2 ( n ) , 且 X X Y独立,则 t=XY/n t = X Y / n 的分布称为自由度为 n n t分布

3)正态方差
均值 μ μ 未知,样本数 n n 已知,
(n1)S2σ2( χ2(n1) χ 2 ( n − 1 ) )作为轴量给出方差 σ2 σ 2 得到置信区间。

4)两正态均值差
同正态均值的思路

5)两正态方差比

F F 分布F(n,m)
Xχ2(n) X ∼ χ 2 ( n ) , Yχ2(m) Y ∼ χ 2 ( m ) ,且 X X Y独立,则 F=X/nY/m F = X / n Y / m 的分布称为自由度是 n n m F F 分布

假设检验

步骤
1)建立假设,原假设与备择假设
常把没有把握不能轻易肯定的命题作为备择假设,把没有充分理由不能轻易否定的命题作为原假设,只有理由充足时才会拒绝它,否则保留。
2)寻找检验统计量(由于要确认原假设是否为真,那么我们先假定原假设成立,然后用样本去判断真伪,而样本信息较为分散,所以要构造一个统计量帮助判断)
3)显著水平与临界值
显著水平即为原假设为真但被拒绝的概率
两类错误:
第一类错误,原假设为真而被拒绝,拒真概率记为α
第二类错误,原假设为假但保留,取伪概率记为 β β
单双边看备择假设
样本容量固定时,两者一般一个大一个小,不能同时减小,所以抽取样本时,尽量使样本容量大一点,可减小两类错误。
4)作判断,拒绝或保留原假设

关于均值的检验
1)方差已知
X¯ X ¯ 作为检验统计量

2)方差未知
X¯μ0S/n X ¯ − μ 0 S / n 作为检验统计量

关于方差的检验
(n1)S2σ20 ( n − 1 ) S 2 σ 0 2 作为检验统计量

两正态总体方差
S2XS2Y S X 2 S Y 2 作为检验统计量

两正态总体均值差
同正态均值的思路

p值

前面所讨论的检验问题是在分布形式已知的前提下对分布的参数进行的,他们都属于参数假设检验问题,当我们对总体分布知之甚少时,就要采用非参数检验。

χ2 χ 2 拟合优度检验
用来检验一批分类数据所来自的总体的分布是否与某种理论分布相一致。

1)总体可分为有限类,但总体分布不含未知参数。(此时 pi p i 已知)
总体 X X 可分为r类,记为 A1,...Ar A 1 , . . . A r
H0:p(Ai)=pi,i=1,...r H 0 : p ( A i ) = p i , i = 1 , . . . r
n n 充分大且H0为真时, χ2=i=1r(ninpi)2npi χ 2 = ∑ i = 1 r ( n i − n p i ) 2 n p i 近似服从自由度为 r1 r − 1 χ2 χ 2 分布

2)总体可分为有限类,但总体分布含 k k 个未知参数。(此时pi未知,可用极大似然估计去代替,相应的自由度减 k k

3)总体为连续分布的情况
H0:X服从分布 F(x) F ( x )
把检验问题转化为分类数据的检验问题

列联表的独立性检验
H0:pi,j=pi,.p.,ji,j H 0 : p i , j = p i , . p . , j ∀ i , j
χ2=ri=1cj=1(nijnpi,j)2npi,j=ri=1cj=1(nijnpi,.p.,j)2npi,.p.,j χ 2 = ∑ i = 1 r ∑ j = 1 c ( n i j − n p i , j ) 2 n p i , j = ∑ i = 1 r ∑ j = 1 c ( n i j − n p i , . p . , j ) 2 n p i , . p . , j
pi,.p.,j p i , . p . , j 使用极大似然估计去替换
p^i,.=ni,.n p ^ i , . = n i , . n
p^.j=n.,jn p ^ . j = n . , j n
即采用检验统计量
χ2=ri=1cj=1(nijnp^i,.p^.j)2np^i,.p^.j χ 2 = ∑ i = 1 r ∑ j = 1 c ( n i j − n p ^ i , . p ^ . j ) 2 n p ^ i , . p ^ . j 自由度为 n(r+c2)=(r1)(c1) n − ( r + c − 2 ) = ( r − 1 ) ( c − 1 )

方差分析

单因子方差分析
因子–变量,水平–变量的不同过取值

设因子 A A r个水平 A1,..,Ar A 1 , . . , A r ,每一水平下都可以看成一个总体,现有 r r 个水平,故有r个总体,假定
1)每一总体服从正态分布
2)每一总体方差相同
3)从每一总体中抽出的样本独立
比较哥哥总体的均值是否一致
H0:μ1=...=μr H 0 : μ 1 = . . . = μ r
H0 H 0 为真时,称该因子的各水平间无显著差异,简称该因子不显著。

方差分析检验具有相同方差的正态总体均值是否相等
ai a i 称为因子 A A 的第i水平的主效应,原假设可改写为
H0:a1=...=ar=0 H 0 : a 1 = . . . = a r = 0

总偏差平方和
ST=i=1rj=1mi(yi,jy¯)2 S T = ∑ i = 1 r ∑ j = 1 m i ( y i , j − y ¯ ) 2
由于假设原假设为真,所以除去一个常数项(方差)后服从自由度为 n1 n − 1 χ2 χ 2 分布

组内偏差平方和(误差偏差平方和)
Sϵ=i=1rj=1mi(yi,jyi,.¯)2 S ϵ = ∑ i = 1 r ∑ j = 1 m i ( y i , j − y i , . ¯ ) 2
除去一个常数项(方差)后服从自由度为 nr n − r χ2 χ 2 分布

因子 A A 的偏差平方和
SA=i=1rj=1mi(yi,.¯y¯)2=i=1rmi(yi,.¯y¯)2

ST=Sϵ+SA S T = S ϵ + S A
由于假设原假设为真,所以 SA S A 除去一个常数项(方差)后服从自由度为 r1 r − 1 χ2 χ 2 分布

采用检验统计量 F=SA/(r1)Sϵ/(nr) F = S A / ( r − 1 ) S ϵ / ( n − r )

多重比较
当因子显著时,如何进一步去确认哪些水平减的确有差异,哪些水平间无显著差异。同时比较任意两个水平间有无显著差异的问题叫做多重比较。

一元线性回归

回归分析是研究变量间相关关系的一种统计方法
yi=β0+β1xi+ϵi,i=1,2,...,n y i = β 0 + β 1 x i + ϵ i , i = 1 , 2 , . . . , n 其中 ϵi ϵ i 相互独立且服从均值为零的正态分布 N(0,σ2) N ( 0 , σ 2 )

回归系数如何估计?
一个直观的想法是观测值与估计值的偏差越小越好,转化为求偏差平方和达到最小,即最小二成估计

回归方程是否有意义?
H0:β1=0 H 0 : β 1 = 0
F检验,类似于方差分析,从偏差平方和分解入手。
F=SR/1SE/(n2) F = S R / 1 S E / ( n − 2 )

t检验( β1^ β 1 ^ 服从正态分布) t=β1^σ^/lxx t = β 1 ^ σ ^ / l x x

相关系数检验 r2=l2xylxxlyy=11+n2F r 2 = l x y 2 l x x l y y = 1 1 + n − 2 F

可化为一元线性回归的曲线回归
相关指数(类似于一元线性回归方程中的相关系数)
R2=1i(yiyi^)2i(yiy¯)2 R 2 = 1 − ∑ i ( y i − y i ^ ) 2 ∑ i ( y i − y ¯ ) 2 越大越好。

剩余标准差
s=i(yiyi^)2n2 s = ∑ i ( y i − y i ^ ) 2 n − 2 越小越好

  • 14
    点赞
  • 71
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 概率论与数理统计是一门涉及到很多概念和公式的学科,需要花费一定的时间和精力进行复习。以下是一些复习建议: 1. 温故知新:复习前需要回顾课本、笔记或者习题集的重点内容,掌握概念、公式和方法。这可以帮助你更好地理解难点,并准确把握需要掌握的知识点。 2. 多练习题:练习题是巩固知识和提高技能的重要途径。通过多做一些典型的习题,可以更好地理解和掌握概率论和数理统计的知识点。 3. 理解思想方法:概率论和数理统计是建立在一些基本的思想方法上的。例如,概率的计算方法、假设检验的思想、回归分析的思路等等。理解这些方法的思想,有助于理解和记忆公式和结论。 4. 找到学习方法:学习方法因人而异。有的人适合记忆公式和结论,有的人则需要理解思想方法,才能更好地掌握概率论和数理统计。在复习,需要找到适合自己的学习方法,提高学习效率。 5. 合理安排时间:概率论和数理统计的复习需要花费一定的时间和精力。在安排复习时间时,需要合理安排每天的学习任务和时间,并注意调整自己的学习状态和心态,以保证复习效果。 ### 回答2: 概率论与数理统计是一门重要的数学学科,需要系统地进行复习和巩固。 首先,复习时应该重点关注概率论和统计学的基本概念和原理。包括概率的定义、条件概率与独立性、贝叶斯公式等基本概率理论,以及离散和连续随机变量的概率分布、期望和方差等统计学基本概念。 其次,复习时需要熟悉概率论和统计学的相关公式和定理,并能够熟练运用。例如,二项分布、正态分布、泊松分布等常见的概率分布,以及大数定律、心极限定理等重要的概率论和统计学定理。 此外,复习时还应该进行大量的习题和例题训练。通过解答各种类型的概率论和数理统计问题,可以加深对知识点的理解和掌握。可以选择一些经典的习题和例题,也可以通过参考教材上的习题集和相关的辅导资料进行练习。 最后,需要留出足够的时间进行综合复习和总结。将已学的知识进行归纳和总结,形成自己的复习笔记和思维导图,方便日后查阅。同时,还可以找一些相关的综合性试题进行模拟考试,检验自己的学习成果。 总之,概率论与数理统计复习需要系统性和综合性。通过理论概念的复习、公式和定理的熟练应用、大量习题的训练以及综合性的总结和模拟考试,可以加深对概率论和数理统计的理解和掌握,为应对考试做好充分准备。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值