![](https://img-blog.csdnimg.cn/20200210061709788.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
统计学
文章平均质量分 93
UA Stat PhD的课程笔记
一个不愿透露姓名的孩子
这个作者很懒,什么都没留下…
展开
-
统计推断 完备性与完备统计量的思想与历史渊源
因为这一年来有很多人问统计推断里的完备性到底要怎么理解,和泛函分析里的完备性是不是一回事之类的问题,所以今天结合数理统计学史给大家介绍一下完备性的渊源。我去除了大部分需要测度论的内容,但保留了一些测度论的概念,好让大家知道这篇文章确实是关于高等数理统计的。原创 2023-02-22 06:46:59 · 1315 阅读 · 1 评论 -
贝叶斯统计:Inverted Beta与Three Parameter Beta分布
贝叶斯统计:Beta分布与Inverse Beta分布原创 2021-10-15 01:37:41 · 328 阅读 · 0 评论 -
贝叶斯统计:信噪对偶与Dawid定理
贝叶斯统计:信噪对偶与Dawid定理信噪对偶Dawid定理Dawid定理由Dawid (1973)提出,是贝叶斯理论中对贝叶斯模型的边缘密度做渐近分析的重要工具之一,虽然后续也有文章对Dawid定理的条件进行了改进,比如O‘Hagan (1979),但Dawid定理的思想还是很有意义的。所以这一篇就简单介绍一下Dawid定理的思想及其证明。信噪对偶假设Observation满足X∼f(x−θ)X \sim f(x-\theta)X∼f(x−θ),也就是只引入θ\thetaθ这个位置参数,θ\thet原创 2021-09-21 02:12:46 · 139 阅读 · 0 评论 -
马尔可夫“折棍子”过程 Markovian Stick-breaking Process 在直方图平滑中的应用
马尔可夫“折棍子”过程 Markovian Stick-breaking Process 在直方图平滑中的应用用Dirichlet prior做Histogram Smoothing用Markovian Stick-breaking Prior做Histogram Smoothing上一篇介绍了Markovian Stick-breaking Process的构造,这一篇介绍它在非参贝叶斯统计中的一个简单应用——Histogram Smoothing。用Dirichlet prior做Histogram原创 2021-06-11 01:30:34 · 247 阅读 · 0 评论 -
Paper Review: Bayesian Regularization and Prediction
Paper Review: Bayesian Regularization and PredictionOne-group Answers to Two-group questionsTwo-group questions: I think this means two alternatives of βi=0\beta_i=0βi=0 or βi≠0\beta_i \ne 0βi=0.Two-group answers: decrete mixture priors of βi\beta_i原创 2021-03-08 07:32:49 · 199 阅读 · 0 评论 -
aMCMC for Horseshoe: algorithms
aMCMC for HorseshoeA limitation of Bayesian shrinkage: lack of computational efficiency under very-high dimension.FrameworkL(z∣Wβ,σ2)=(2πσ2)−N2e−12σ2(z−Wβ)′(z−Wβ)βj∣σ2,ηj,ξ∼iidN(0,σ2ξηj),j=1,⋯ ,pη−1/2∼iidC+(0,1),ξ∼C+(0,1),σ2∼IG(w2,w2)L(z|W\beta,\sigma^2原创 2021-02-03 05:23:51 · 137 阅读 · 0 评论 -
Variational Inference Review
Variational Inference ReviewIdea: posit a family of density and find one from the family that is the closest (in K-L divergence) to the target density.For statisticians: VI provides a method to approximate complicate densities. Compared with MCMC, it’s e原创 2021-03-05 06:10:09 · 218 阅读 · 1 评论 -
LDA Effect Size分析 LEfSe详解
LDA Effect Size分析 LEfSe详解LEfSe的作用LEfSe的原理LEfSe的作用在介绍LEfSe的作用前,我们先解释一个概念——biomarker,维基百科给出的定义是A bio-marker, or biological marker is a measurable indicator of some biological state or condition. Biomarkers are often measured and evaluated to examine norma原创 2020-12-23 07:00:08 · 7154 阅读 · 3 评论 -
R语言 非中心化F分布
R语言 非中心化F分布非中心化F分布的定义R语言中的非中心化F分布非中心化F分布的定义非中心化的F分布有两种不同的定义方式,这两种不同的定义方式源于两种不同的非中心化卡方分布的定义。定义一(可以参考陈希孺的数理统计引论第一章) 假设X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn互相独立,并且Xi∼N(ai,1)X_i \sim N(a_i,1)Xi∼N(ai,1),则称∑i=1nXi2∼χ2(n,δ)\sum_{i=1}^n X_i^2 \sim \chi^2(n,\delta)原创 2020-11-23 04:55:00 · 2397 阅读 · 1 评论 -
R语言编程 第一讲 变量与赋值
R语言编程 第一讲 变量名、变量名称与变量值R语言的变量名赋值符号 <- 与 = 的区别赋值符号 <- 的更多细节Copy-on-Modify与Modify-in-Place函数调用命名变量存储空间环境内存回收这个系列将系统性介绍R语言的理论与实践,R语言是专注应用统计与数据分析领域的最热门的开源语言,兼具函数编程与面向对象编程的特点。R语言的使用门槛非常低,如果只是用来估计特定模型,那么只需要输入输出会调包就可以了,但总要有人去写以及优化这些包,所以我们在使用R语言之前,有必要系统性学习一下原创 2020-08-21 09:54:18 · 8613 阅读 · 3 评论 -
UA MATH566 用Basu定理证明统计量不完备
UA MATH566 用Basu定理证明统计量不完备Basu定理:有界完备最小充分统计量与辅助统计量独立。我们先简单证明一下这个定理,记有界完备最小充分统计量为T(X)T(X)T(X),辅助统计量为A(X)A(X)A(X),则要证明二者独立,只需要PX{A(X)∈B∣T(X)=t}=PX{A(X)∈B},B是Borel集P_X\{A(X) \in B|T(X)=t\} = P_X\{A(X) \in B\},B是Borel集PX{A(X)∈B∣T(X)=t}=PX{A(X)∈B},B是Borel原创 2020-08-07 11:50:44 · 1798 阅读 · 1 评论 -
UA MATH 571B Tukey‘s Test for Non-additivity
UA MATH 571B Tukey's Test for Non-additivity实现上面这个方法的例子:data wash;input stain soap y @@;cards;1 1 45 1 2 47 1 3 48 1 4 42 2 1 43 2 2 46 23 50 2 4 37 3 1 51 3 252 3 3 55 3 4 49;run;proc glm data = wash;class stain soap;model y = soap stain;原创 2020-08-07 10:50:40 · 257 阅读 · 0 评论 -
Split-plot设计 SAS实践
Split-plot设计 SAS实践试验资源的限制第一种统计模型GLM procedureMixed procedure第二种统计模型GLM procedureMixed procedureSplit-plot设计有两大难点,第一个难点是判断什么时候用split-plot设计;第二个难点是判断哪些效应可以省略。某造纸厂工程师试图研究如何提高纸张的抗拉强度,为此他选择了3种纸浆制备方法、完成每种方法时分别使用四种不同的温度,重复试验三次,一共需要试验36组。受制备中间程序限制,每天只能完成12组试验,他打算原创 2020-08-07 10:30:54 · 1414 阅读 · 0 评论 -
随机效应与混合效应模型 SAS实践
随机效应与混合效应模型 SAS实践两个处理变量都具有固定效应两个处理变量都具有随机效应GLM procedureMixed procedure, type 1 methodMixed procedure, REML method只有一个处理变量具有随机效应GLM procedureRestricted ModelUnrestricted Model两两比较Mixed procedure精密仪器制造非常依赖零部件尺寸的精确度。一位工程师随机选取了三种仪器对某零部件的二十个关键部位进行了测量,每一个部位重复测原创 2020-08-07 09:21:13 · 13254 阅读 · 0 评论 -
平衡不完全区组设计 数据分析的SAS实践
平衡不完全区组设计 数据分析的SAS实践数据的定性分析:平衡不完全区组设计的参数ANOVA:使用催化剂是否能够显著提高产率?ANOVA之后的分析:哪种催化剂效果更好?某一个药学研究团队想要研究四种不同的催化剂对甲硝唑产率的影响。该团队订购了四批相同的原材料,以原材料的批次作为区组、催化剂作为处理变量,设计并完成了一个平衡不完全区组设计,数据记录如下:下面将用这个例子介绍平衡不完全区组试验(Balanced Incompete Blocking Design,BIBD)结果的数据分析方法。数据的定性分原创 2020-08-06 10:41:39 · 2674 阅读 · 0 评论 -
UA MATH566 一个例子:什么是隐状态
UA MATH566 一个例子:什么是隐状态对试验结果的分析对隐状态的分析假设一个包里有三个色子,分别是色子A、色子B和色子C,每个色子的六个面上都标有1-4中的某个数字,其中色子A有两面标1、两面标2、一面标3、一面标4;色子B有两面标2、两面标3、一面标1、一面标4;色子C有三面标4、其余三面分别标1、2、3。先从蒙上眼睛从包中抽取一个色子,用随机变量S表示抽取的色子;再投掷这个色子,让人记下正面朝上的数字后放回。在这个过程中,除了记录者之外,其他人只能得知一共投掷了NNN次,得到1、2、3、4的原创 2020-08-06 07:14:35 · 1703 阅读 · 0 评论 -
UA MATH571B 试验设计 Quarter 2-level析因设计
UA MATH571B 试验设计 Quarter 2-level析因设计2k−22^{k-2}2k−2设计的基本概念2k−22^{k-2}2k−2试验结果的SAS分析Quarter 2-level析因设计需要的试验单位比Half 2-level析因设计还要少一半,适用于试验资源更加有限的情况,它的分析方法也与Half 2-level析因设计类似。2k−22^{k-2}2k−2设计的基本概念与2k−12^{k-1}2k−1设计通过defining relation决定alias从而确定试验的factor原创 2020-08-05 07:23:32 · 347 阅读 · 0 评论 -
UA MATH571B Things to know about statistical model of experimental design
UA MATH571B Things to know about statistical model of experimental designExperimental with one treatment factorSimple Experiment (Randomized Complete Design)BalancedUnbalancedRCBDLatin Square DesignGraeco-Latin Square DesignBIBDExperimental with multiple t原创 2020-08-04 09:27:07 · 186 阅读 · 0 评论 -
UA MATH566 例题 Poisson回归、Overdispersion与负二项回归
UA MATH566 例题 Poisson回归、Overdispersion与负二项回归Poisson regression is widely used in modelling count data. Model assumption is Yi∼iidPois(βxi),i=1,⋯ ,nY_i \sim_{iid} Pois(\beta x_i),i=1,\cdots,nYi∼iidPois(βxi),i=1,⋯,n, β∈R1\beta \in \mathbb{R}^1β∈R1.Part原创 2020-07-30 01:42:05 · 580 阅读 · 0 评论 -
UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质
UA MATH566 统计理论 一个例题 Hierarchical Model的统计性质Y∣X∼Pois(X)Y|X \sim Pois(X)Y∣X∼Pois(X) and X∼Γ(α,β)X \sim \Gamma(\alpha,\beta)X∼Γ(α,β). Y1,⋯ ,YnY_1,\cdots,Y_nY1,⋯,Yn are random sample from population YYY.Part (a) Find EYEYEYPart (b) Find Var(Y)Var(Y)Var原创 2020-07-29 11:54:17 · 152 阅读 · 0 评论 -
UA MATH566 统计理论 推导卡方拟合优度检验
UA MATH566 统计理论 推导卡方拟合优度检验原创 2020-07-27 07:42:47 · 379 阅读 · 0 评论 -
UA MATH566 统计理论 Bayes统计基础
UA MATH566 统计理论 Bayes统计基础原创 2020-07-26 08:31:36 · 196 阅读 · 0 评论 -
UA MATH566 统计理论 概念与定理总结
UA MATH566 统计理论 概念与定理总结Part 1 Exponential FamilyPart 2 Sufficient Statistics and Complete StatisticsPart 3 C-R Inequality and Fisher InformationPart 4 Point EstimationPart 5 Hypothesis TestingPart 6 Confidential IntervalPart 7 Basic Bayesian Statist原创 2020-07-20 09:33:39 · 371 阅读 · 0 评论 -
UA MATH566 统计理论 QE练习 位置变换后的指数分布
UA MATH566 统计理论 QE练习 位置变换后的指数分布原创 2020-07-19 08:38:08 · 251 阅读 · 0 评论 -
UA MATH571B 试验设计 QE练习题 不使用代码分析试验结果I
UA MATH571B 试验设计 QE练习题 不使用代码分析试验结果I2015年5月第一题2016年1月第三题2017年1月第一题2018年1月第三题这一篇介绍2015年5月第一题,2016年1月第三题,2017年1月第一题、2018年1月第三题。不使用代码分析试验结果考察的是对试验设计基本概念与统计方法的掌握程度,但不使用代码难以分析复杂的contract、multiple comparison以及做模型诊断等工作,所以这类题目考察的重点是基本概念和ANOVA table相关计算。2015年5月第一题原创 2020-07-18 04:49:48 · 178 阅读 · 0 评论 -
UA MATH571B 试验设计 QE练习题 平衡非完全区组设计BIBD
UA MATH571B 试验设计 QE练习题 平衡非完全区组设计BIBD2015年1月第一题2018年1月第一题2015年1月第一题Part a显然这是一个BIBD(Balanced Incomplete Blocking Design),treatment factor是gasoline additives,不同的car代表不同的blocking。首先确定几个参数a,b,r,k,λa,b,r,k,\lambdaa,b,r,k,λ。aaa表示treatment factor的level数目,bbb表原创 2020-07-15 13:50:36 · 1055 阅读 · 0 评论 -
UA MATH571B 试验设计 总结 判断试验类型的例题
UA MATH571B 试验设计 总结 判断试验类型的例题2015年5月第二题:Blocking factorial design2015年5月第三题:Split-plot Design2017年1月第一题:One-factor Random Effect Design2017年1月第二题:RCBD2017年1月第三题:232^323 factorial design with 3 replicates2017年5月第一题:Nested Design2017年5月第三题:RCBD这是2015年5月的2-3原创 2020-07-15 09:56:11 · 342 阅读 · 0 评论 -
UA MATH571B 试验设计 总结 试验的类型与选择
UA MATH571B 试验设计 总结 试验的类型与选择试验的意义,试验设计的意义单个treatment factor的试验多个treatment factor的试验多个treatment factor、且包含随机效应的试验最近做qualify往年题目的时候,发现试验设计的题目第一小问往往是判断试验类型,这个问题才是试验设计这整个学科的精华。这类题目已知条件多种多样,有文字描述试验设计背景的,有展示试验数据的,还有展示分析试验数据的SAS输出的,要准确判断试验类型,就需要对所有的试验设计基本概念有深刻了解原创 2020-07-14 12:36:10 · 537 阅读 · 0 评论 -
UA MATH566 统计理论 Fisher信息论的性质下
UA MATH566 统计理论 Fisher信息量的性质下辅助统计量的Fisher信息为0分布族参数变换后的Fisher信息统计量的Fisher信息的有界性下面介绍一些Fisher信息量的常用性质。辅助统计量的Fisher信息为0假设A(X)∼g(a,θ)A(X)\sim g(a,\theta)A(X)∼g(a,θ),它的Fisher信息为IA(X)(θ)=E[S(A,θ)]2=E[∂logg(A,θ)∂θ∂loggT(A,θ)∂θ]IA(X)(θ)=0⇔E[∂logg(A,θ)∂θ∂log原创 2020-07-13 10:55:52 · 1593 阅读 · 0 评论 -
UA MATH566 统计理论 Fisher信息量的性质上
UA MATH566 统计理论 Fisher信息论的性质原创 2020-07-12 13:19:20 · 3699 阅读 · 0 评论 -
UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系
UA MATH566 统计理论 Cramer-Rao不等式与Delta方法的联系Delta方法与C-R不等式基本概念回顾Delta方法近似在math 564概率论与math 566统计理论中,我们一共掌握了三种对复杂统计量的方差做近似的方法,分别是delta方法、Cramer-Rao不等式以及Bootstrap。Bootstrap与前两者的联系到介绍到统计计算的时候讨论,这一讲先介绍delta方法、Cramer-Rao不等式的联系。Delta方法与C-R不等式基本概念回顾在UA MATH564 概率论原创 2020-07-12 07:06:51 · 2016 阅读 · 0 评论 -
UA MATH566 统计理论7 还有一个例子:推导卡方检验
UA MATH566 统计理论7 还有一个例子:推导卡方检验前面的文章中我们已经推导了Z检验和T检验,Z检验是方差已知时比较单个或两个正态总体均值的方法;T检验是方差未知时比较单个或两个正态总体均值的方法。这一讲推导卡方检验,它是比较单个正态总体方差的方法。考虑双边检验:考虑双边的单总体检验:H0:σ2=σ02Ha:σ2≠σ02H_0:\sigma^2 = \sigma_0^2 \\ H_a:\sigma^2 \ne \sigma^2_0H0:σ2=σ02Ha:σ2=σ02假设样本为X1原创 2020-07-12 06:03:50 · 352 阅读 · 0 评论 -
UA MATH571B 2K析因设计 SAS实践 分数2k析因设计
UA MATH571B 2K析因设计 SAS练习题 分数2k析因设计这是2016年五月QE第三题。这道题的背景是nianurnal of quality Technology的paper原创 2020-07-11 13:34:54 · 435 阅读 · 0 评论 -
UA MATH571B 试验设计 2k析因设计理论下
UA MATH571B 试验设计 2k析因设计理论下ConfoundingBlocking 222^222析因设计Fractional 2k2^k2k Design这一讲介绍2k2^k2k析因设计中的blocking、confounding的概念以及分数2k2^k2k析因设计的基本原理。Blocking比较简单,当2k2^k2k析因试验有潜在的nuisance factor的时候就做blocking就可以了,在kkk个treatment factor之外再做blocking的话残差自由度就不会为0,可以做原创 2020-07-09 07:25:39 · 663 阅读 · 0 评论 -
UA MATH571B 试验设计 2k析因设计理论上
UA MATH571B 试验设计 2k析因设计理论上2k2^k2k析因设计Single-replicate 2k2^k2k析因设计2k2^k2k析因设计的最优性2k2^k2k析因设计(factorial design)在QE中几乎是必考的内容,但经过上课作业考试以后感觉还是停留在入门的程度,不得已只能自学一下教材。2k2^k2k析因设计包括的内容是2k2^k2k析因设计的基本原理、Confounding和fractional 2k2^k2k析因设计,分上下两篇博文介绍它们的概念和统计模型。先澄清基本概念原创 2020-07-08 12:06:49 · 587 阅读 · 0 评论 -
UA MATH566 统计理论 用点估计构造置信区间
UA MATH566 统计理论 置信区间的构造方法原创 2020-07-06 09:34:55 · 402 阅读 · 0 评论 -
UA MATH566 统计理论 QE练习题2.2
UA MATH566 统计理论 QE练习题2.2第五题这是2014年5月的5题。第五题Part (a)Joint density of the bivariate normal disrtribution isfY1,Y2(y1,y2)=12πσ21−ρ2exp(−12(1−ρ2)[(Y1−μ)2σ2+(Y2−μ)2σ2−2ρ(Y1−μ)(Y2−μ)σ2])f_{Y_1,Y_2}(y_1,y_2) = \frac{1}{2\pi \sigma^2\sqrt{1-\rho^2}}\exp \l原创 2020-07-06 05:01:50 · 226 阅读 · 0 评论 -
UA MATH566 统计理论 QE练习题2.1
UA MATH566 统计理论 QE练习题2第四题第五题第六题这是2014年5月的4-6题。第四题Part (a)P(X1>0)=∫0∞1θ1+θ2e−xθ1dx=θ1θ1+θ2P(X_1>0 )=\int_{0}^{\infty} \frac{1}{\theta_1+\theta_2}e^{-\frac{x}{\theta_1}}dx = \frac{\theta_1}{\theta_1+\theta_2}P(X1>0)=∫0∞θ1+θ21e−θ1xdx=θ1+原创 2020-07-05 09:52:49 · 254 阅读 · 0 评论 -
UA MATH571B 试验设计 QE练习题1
UA MATH571B 试验设计 QE练习题1第一题第二题第三题这是2014年一月Methodology的1-3题。第一题希望今年的考试没有这种概念题!第一个是对的,比较多正态总体的方差就是FFF检验做的事情。第二个不对,选择Bonferroni方法还是Scheffe方法取决于对多少个统计量做联合推断,如果是对比较多的统计量做联合推断就用Scheffe方法;否则就用Bonferroni方法。第三个不对,Type I SS是sequential SS,要考虑进入模型的顺序;Type III SS原创 2020-07-02 07:20:50 · 317 阅读 · 1 评论 -
UA MATH566 统计理论 QE练习题1
UA MATH566 统计理论 QE练习题1第四题第五题第六题2014年1月理论题目4-6。Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDIwNzk3NA==,size_16,color_FFFFFF,t_70)第四题Part (a)Joint likelihood function of random sample isL(θ)=∏i=1n(θ−ccXic−1e−(Xi/θ)c)=θ−nccn(∏i=1nXi)c−1e−1θc∑i=1nXicl(θ)=logL(θ)原创 2020-07-02 04:26:42 · 305 阅读 · 0 评论