统计模型
文章平均质量分 57
swuteresa
这个作者很懒,什么都没留下…
展开
-
ridge regression岭回归
岭回归用于处理下面两类问题:1.数据点少于变量个数2.变量间存在共线性变量间存在共线性是,最小二乘回归得到的系数不稳定,方差很大,这是因为系数矩阵x与它的转置矩阵相乘得到的矩阵不能求逆,而ridge regression通过引入lamda参数,使得该问题得到解决。在R语言中,MASS包中的函数lm.ridge()可以很方便地完成。它的输入矩阵x始终为n*p维,不管是否包含常数项。原创 2013-02-01 13:56:04 · 36351 阅读 · 0 评论 -
EM算法:Expectation-Maximization
目标:找出有隐形变量的概率模型的最大可能性解。它分为两个过程:E-step和M-step1.E-step:通过最初假设或上一步得出的模型参数得到后验概率;2.M-step:重新算出模型的参数。重复这两个过程直到目标函数值收敛。 EM算法即期望值最大算法,被誉为是数据挖掘的十大算法之一,它是在概率模型中寻找参数最大似然估计的算法。其中概率模型依赖于无法观测到的隐变量。最大期望原创 2013-02-01 20:55:11 · 1065 阅读 · 0 评论 -
lmer:Fit mixed-Effects Models
lmer{lmer4}拟合一个线性混合模型或通用线性混合模型或非线性混合模型 lmer(formula,data,family=NULL,REML=TRUE,control=list(),start=NULL,verbose=FALSE,doFit=TRUE,sunset,weights,na,action,offset,contrasts=NULL,model=TRUE,X=TRUE原创 2013-02-02 15:58:24 · 15981 阅读 · 0 评论 -
mixed model混合模型
混合模型是一个统计模型,包含fixed effects和random effects两种效应的混合。当重复衡量(1)相同的统计单元,或(2)聚类,或(3)相关的统计单元时,混合模型尤其有效。Ronald Fisher研究亲属间性状值的相关性时,引入random effects modes。1950年代,Charles Roy Henderson提出(1)fixed effects的BL原创 2013-02-01 20:38:50 · 18216 阅读 · 0 评论 -
mer类
lmer函数的结果为一个mer类的对象 mer类:描述线性、通用线性或非线性混合效应模型,包含稀疏的模型矩阵(随机效应的)以及相应的稀疏Cholesky因子。summary.mer类描述这些对象的summary。 用法:deviance(object,REML=NULL,...)expand(x,sparse=TRUE,...)logLik(object,REML=原创 2013-02-02 16:50:48 · 986 阅读 · 0 评论 -
how to calculate ANOVA
有段很好的视频:http://www.youtube.com/watch?v=-yQb_ZJnFXw原创 2013-04-07 11:20:05 · 772 阅读 · 0 评论 -
Synbreed与rrBLUP
Synbreed中的RRBLUP模型(用函数gpMod实现)与rrBLUP包中的kin.blup:若使用同一个数据集,同一个relationship矩阵,则得出的结果相近。区别:1.gpMod中使用的kin矩阵为kin.blup中kin矩阵的一半。2.kin.blup结果中的Vg为gpMod结果中fit的分量sigma的第一个值kinTS的1000倍。Vg:遗传方差Ve:剩余方原创 2013-05-01 17:19:34 · 3394 阅读 · 0 评论 -
BLUE和BLUP
BLUE:将基因型当作fixed effects。估计出表型值的BLUE,用以修正田间实验误差(要考虑不同的实验设计),得到的结果(表型值的BLUE)作为其他后续方法training时的表型值使用。BLUP:将基因型当作random effects。估计出方差组分(可由此计算出遗传率,用于计算Bayesian方法中的先验参数等),得到表型值的BLUP作为其他后续方法用于评估预测准确度时的TBV原创 2013-05-07 08:50:31 · 4808 阅读 · 0 评论