《数理统计》学习笔记
《数理统计》(韦来生版)的学习总结。
江景页
学习笔记移步博客园发表。
https://www.cnblogs.com/jy333/
展开
-
01.第一章 绪论
第一章 绪论1.数理统计的基本概念总体、个体与样本:所有的个体集合起来构成总体,从总体中抽出一部分个体作为研究对象,这个研究对象称为样本。样本中个体的数目称为样本大小(样本容量),抽取的过程叫做抽样。总体(总体分布):总体可以用一个随机变量及其概率分布来刻画。总体可以视为一个随机变量XXX,也可以用其分布函数FFF来表示,若其有密度也可以用密度函数fff来表示。样本:从总体中抽取一部分样本组成,如样本X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯原创 2020-09-10 17:10:28 · 420 阅读 · 0 评论 -
02.第二章 抽样分布及若干预备知识(1)
第二章 抽样分布及若干预备知识(1)1.正态随机变量的线性组合正态随机变量的线性组合:设随机变量X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn相互独立,且Xk∼N(ak,σk2)X_k\sim N(a_k, \sigma_k^2)Xk∼N(ak,σk2),有常数c1,⋯ ,cnc_1,\cdots,c_nc1,⋯,cn,记T=∑k=1nckXkT=\sum_{k=1}^n c_kX_kT=∑k=1nckXk,则T∼N(μ,τ2),μ=∑k=1nckak,τ2=∑i=1nc原创 2020-09-10 22:35:25 · 470 阅读 · 0 评论 -
03.第二章 抽样分布及若干预备知识(2)
第二章 抽样分布及若干预备知识(2)1.单个次序统计量的分布现假设X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn是来自总体FFF的简单随机样本,fff是FFF的密度,(X(1),⋯ ,X(n))(X_{(1)},\cdots,X_{(n)})(X(1),⋯,X(n))是其次序统计量。现在要求第kkk个次序统计量X(k)X_{(k)}X(k)的分布,先求出它的概率密度函数。由于其密度函数fk(x)f_k(x)fk(x)是分布函数Fk(x)F_k(x)Fk(x)的导数,即fk(x原创 2020-09-10 22:41:01 · 308 阅读 · 0 评论 -
04.第二章 抽样分布及若干预备知识(3)
第二章 抽样分布及若干预备知识(3)1.Γ\GammaΓ分布与B\BetaB分布在了解Γ\GammaΓ分布与B\BetaB分布之前,要先知道Γ\GammaΓ函数和B\BetaB函数。Γ\GammaΓ函数:定义为Γ(x)=∫0∞tx−1e−tdt⋅I(x>0)\Gamma(x)=\int_0^\infty t^{x-1}e^{-t}dt \cdot I_{(x>0)}Γ(x)=∫0∞tx−1e−tdt⋅I(x>0)。其主要取值为Γ(1)=∫0∞e−tdt=1,Γ(12)=∫0∞原创 2020-09-10 22:47:19 · 386 阅读 · 0 评论 -
05.第二章 抽样分布及若干预备知识(4)
第二章 抽样分布及预备知识(4)1.极限分布极限分布:当样本容量nnn趋向于无穷时,统计量的分布趋向于一个确定分布,这个确定分布便称为统计量的极限分布,也常称为大样本分布。样本容量n→∞n\to\inftyn→∞时的性质称为大样本性质。大样本性质与小样本性质的区别不在于样本个数的多杀,而在于是否是在n→∞n\to\inftyn→∞的前提下考虑。2.指数族的判定指数族:设F={f(x,θ):θ∈Θ}\mathscr F=\{f(\boldsymbol x,\theta):\theta\in\Thet原创 2020-09-10 22:53:12 · 492 阅读 · 0 评论 -
06.第三章 点估计(1)
第三章 点估计(1)1.点估计的基本属性点估计:X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯,Xn)作为某个总体的样本,g^(X1,⋯ ,Xn)\hat g(X_1,\cdots,X_n)g^(X1,⋯,Xn)是样本的函数,用g^(X)\hat g(\boldsymbol X)g^(X)的值作为g(θ)g(\theta)g(θ)的估计,称为点估计。简单来说,就是用某种函数来处理一个样本,得到的数据作为某个参数的函数的估计值。采取不同的函原创 2020-09-10 22:56:41 · 485 阅读 · 0 评论 -
07.第三章 点估计(2)
第三章 点估计(2)1.极大似然法极大似然原理:对于某个给定的样本,当参数θ\thetaθ取θ1\theta_1θ1时,这个样本的出现概率要比参数θ2\theta_2θ2时更大,在所有的参数中,使得样本出现概率最大的参数θ^\hat \thetaθ^则为其极大似然估计。判断哪个参数对应的样本出现概率最大,使用似然函数。设f(x,θ)=f(x1,⋯ ,xn,θ)f(\boldsymbol x,\theta)=f(x_1,\cdots,x_n,\theta)f(x,θ)=f(x1,⋯,xn,θ)为样原创 2020-09-10 23:01:43 · 254 阅读 · 0 评论 -
08.第三章 点估计(3)
第三章 点估计(3)1.一致最小均方误差估计均方误差MSE:均方误差值样本偏离参数实际值平方的大小,即(g^(X)−g(θ))2(\hat g(X)-g(\theta))^2(g^(X)−g(θ))2,它与偏差g^(X)−g(X)\hat g(X)-g(X)g^(X)−g(X)的区别是,可以消除偏差正负相互抵消的影响,也可以直接用数值大小判断优劣。显然我们希望估计量g^(X)\hat g(X)g^(X)的均方误差越小越好。如果对于任何θ∈Θ\theta\in\Thetaθ∈Θ,都有Eθ(g^1(原创 2020-09-10 23:05:03 · 757 阅读 · 0 评论 -
09.第三章 点估计(4)
第三章 点估计(4)1.Cramer-Rao不等式(C-R不等式)C-R不等式是判别一个无偏估计量是否为UMVUE的方法之一,其思想是对于g(θ)g(\theta)g(θ)的无偏估计类Ug\mathscr U_gUg,里面的无偏估计有一个方差下界,如果能找到一个g^\hat gg^的方差到达这个下界,这个g^\hat gg^就是g(θ)g(\theta)g(θ)的一个UMVUE。这个方差下界,就由C-R不等式取得。要满足这个不等式,需要满足一定的条件——正则条件。对于单参数概率函数族F={f(x原创 2020-09-10 23:07:41 · 926 阅读 · 0 评论 -
10.第四章 区间估计(1)
第四章 区间估计(1)1.区间估计的基本概念区间估计,指用一个误差限d(X)d(\boldsymbol X)d(X)作为点估计的偏离限度,将g(θ)g(\theta)g(θ)的取值限制在[g^(X)−d(X),g^(X)+d(X)][\hat g(\boldsymbol X)-d(\boldsymbol X),\hat g(\boldsymbol X)+d(\boldsymbol X)][g^(X)−d(X),g^(X)+d(X)]之中。更一般地,取两个具有确定大小关系的统计量g^1(X)≤g^2(原创 2020-09-10 23:09:36 · 1062 阅读 · 0 评论 -
11.第四章 区间估计(2)
第四章 区间估计(2)1.枢轴变量法概述枢轴变量法的核心在于从点估计入手构造置信区间,将点估计T(X)T(\boldsymbol X)T(X)与参数θ\thetaθ复合在一起成为一个变量φ(T,θ)\varphi(T,\theta)φ(T,θ),要求它的表达式与未知参数θ\thetaθ有关,但是分布却与参数无关。由于枢轴变量的表达式与参数有关,因而不是统计量,只能说这是一种构造区间估计的方法。具体的枢轴变量法步骤是:找到一个待估参数μ\muμ的良好点估计T(X)T(\boldsymbol X)T(原创 2020-09-11 23:56:08 · 2184 阅读 · 0 评论 -
12.第五章 参数假设检验(1)
第五章 参数假设检验(1)1.假设检验假设检验问题指通过从总体中抽取一定容量的样本,利用样本来检验总体分布是否具有某种特征。可分为参数型假设检验与非参数型假设检验两种类型,分别适用于总体分布的形式已知和未知的情况。假设:对于一般的问题,总可以提出一种假设,它是人们认为的关于参数的信息,如正态分布中μ≤μ0\mu\le\mu_0μ≤μ0就是一种假设,原假设(也叫零假设)H0H_0H0的对立面是备择假设H1H_1H1。参数检验的问题可以形象地写成H0:θ∈Θ0⟷H1:θ∈Θ1H_0:\theta原创 2020-09-11 23:56:54 · 1133 阅读 · 0 评论 -
13.第五章 参数假设检验(2)
第五章 参数假设检验(2)1.单正态总体均值假设检验先讨论单正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的均值检验。分为单边检验H0:μ=μ0↔H1:μ≠μ0H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne \mu_0H0:μ=μ0↔H1:μ=μ0与双边检验,这里μ0\mu_0μ0和检验水平α\alphaα是给定的数,X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯,Xn)是从正态总体原创 2020-09-11 23:57:54 · 833 阅读 · 0 评论 -
14.第五章 参数假设检验(3)
第五章 参数似然检验(3)1.似然比检验似然比检验在假设检验中的地位相当于极大似然估计在点估计中的地位,它可视为极大似然原理在假设检验中的体现。由这种方法构造出的检验,一般具有比较良好的性质,且对分布族没有什么特殊的要求。设有分布族{f(x,θ),θ∈Θ}\{f(x,\theta),\theta\in\Theta\}{f(x,θ),θ∈Θ},X=(X1,⋯ ,Xn)\boldsymbol X=(X_1,\cdots,X_n)X=(X1,⋯,Xn)是取自该总体的简单随机样本,f(x,θ)f(\bol原创 2020-09-11 23:58:48 · 1478 阅读 · 0 评论 -
15.第六章 非参数假设检验(1)
第六章 非参数假设检验(1)1.非参数假设检验概述对于给定分布族的情况,假设检验主要对其中的未知参数进行假设并检验;对于样本分布族未给出其数学形式的情况,只给出其对称性、连续性等假设,这种统计问题是非参数的,要运用与数学形式无关的统计推断方法,即非参数方法。非参数方法的特点有,适用面广而针对性差,比较依赖于大样本理论,只能使用样本中的“一般”信息(如位置、次序关系),具有稳健性(即真实的模型与设定的理论模型有一定偏离时也能保持较好的性质)。2.符号检验法符号检验法适用于相互独立的两样本的成对数据。原创 2020-09-12 00:00:03 · 677 阅读 · 0 评论 -
16.第六章 非参数假设检验(2)
第六章 非参数假设检验(2)1.拟合优度检验拟合优度,即利用总体XXX中抽取的样本X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn,来检验H0:r.v. X的分布为FH_0:\text{r.v. }X的分布为FH0:r.v. X的分布为F这一假设。然而,对于总体分布,用符号、不符合这种说法未免过于绝对,因此通常是提出一个介于0到1之间的数值来衡量拟合的优劣程度,称作拟合优度。拟合优度一般如此定义:p(d0)=P(D≥d0∣H0)p(d_0)=P(D\ge d_0|H原创 2020-09-12 00:00:47 · 567 阅读 · 0 评论 -
17.第七章 Bayes方法和统计决策理论(1)
第七章 Bayes方法和统计决策理论(1)1.Bayes学派的观点经典统计学作统计推断的信息来源,是总体信息和样本信息,即总体来自哪个分布族,还有抽样得到的样本观测值以及依据样本算得的统计量值。贝叶斯学派还依赖于先验信息,即在进行抽样之前,有关统计推断问题中未知参数的一些信息,来自资料、历史等外界因素。先验分布:参数空间Θ\ThetaΘ上的任一概率分布都称为先验分布,这种分布主要是在抽取样本XXX之前,对参数θ\thetaθ可能取值的一种认识,记作Fπ(θ)F^\pi(\theta)Fπ(θ),密度函原创 2020-09-12 00:01:49 · 940 阅读 · 0 评论 -
18.第七章 Bayes方法和统计决策理论(2)
第七章 Bayes方法和统计决策理论(2)1.Bayes点估计与区间估计在点估计方面,有了后验分布以后,可以按照后验分布求未知参数θ\thetaθ的点估计。一般常用以下三种估计:后验众数估计:使后验密度π(θ∣x)\pi(\theta|x)π(θ∣x)达到最大时的θ\thetaθ值,也称为后验密度的众数,用后验密度的众数作为θ\thetaθ的估计称为后验众数估计,也称为广义极大似然估计,记作θ^MD\hat \theta_{MD}θ^MD。后验中位数估计:用后验分布的中位数作为θ\thetaθ估原创 2020-09-12 00:03:10 · 1487 阅读 · 0 评论 -
19.数理统计备考(1)
备考篇(1)第一章本章是数理统计中的基本知识和基础概念,包含样本、统计量、样本分布、经验分布函数等基本内容。样本是从总体中抽取的一部分个体,具有两重性。当样本作为随机变量看待时,拥有和总体一样的分布函数,同时样本也有联合分布函数,其联合密度函数或联合密度函数为f(x1,⋯ ,xn)=f(x1)f(x2)⋯f(xn)f(x_1,\cdots,x_n)=f(x_1)f(x_2)\cdots f(x_n)f(x1,⋯,xn)=f(x1)f(x2)⋯f(xn)统计量是样本的函数,是根据样本可原创 2020-09-12 00:04:12 · 885 阅读 · 1 评论 -
20.数理统计备考(2)
数理统计备考(2)第三章本章是点估计,包含点估计的评定法则、矩估计、极大似然估计、UMVUE、CR不等式等内容。点估计指的是用一个统计量来作为一个未知参数(函数)的估计值。用来估计一个未知参数的点估计有很多种,它们的优劣程度有一系列判断准则。无偏性:Eθ^=θE\hat \theta=\thetaEθ^=θ是否成立,或者n→∞n\to\inftyn→∞时是否有Eθ^n→θE\hat\theta_n\to\thetaEθ^n→θ。有效性:Dθ^D\hat\thetaDθ^是大还是小。相合性:是原创 2020-09-12 00:06:19 · 1937 阅读 · 0 评论 -
21.数理统计备考(3)
数理统计备考(3)第四章本章是区间估计,包含区间估计的评判标准、置信水平、数轴变量法等内容。区间估计指的是用两个具有严格大小关系的统计量作为待估参数的上下界,即认为待估参数属于这个区间。同一个待估参数会有不同的区间估计,也有一些指标用来评价它们的优劣。可靠度:待估参数被估计区间包含的可能性大小。精度:随机区间的平均长度。衡量可靠度使用置信水平,置信水平指区间估计包含待估参数概率的对θ\thetaθ的下确界。精度即E(θ^2−θ^1)E(\hat\theta_2-\hat\theta_1)E(原创 2020-09-12 00:06:57 · 683 阅读 · 0 评论 -
22.数理统计备考(4)
数理统计备考(4)第五章本章是参数假设检验。参数检验拥有一个原假设和一个备择假设,两个假设是互斥的,一般把等号放在原假设H0H_0H0。一般假设检验的形式是:H0:θ∈Θ0↔H1:θ∈Θ1H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1H0:θ∈Θ0↔H1:θ∈Θ1对某一个检验,会使用检验统计量,并且给定一个否定域。当检验统计量TTT落入否定域DDD时,就拒绝H0H_0H0。检验函数是对此检验的一个描述,即φ(x原创 2020-09-12 00:07:39 · 304 阅读 · 0 评论