应用统计
文章平均质量分 91
一个不愿透露姓名的孩子
这个作者很懒,什么都没留下…
展开
-
Logit Beta分布及其R语言随机模拟算法
Logit Beta分布是一个在广义线性模型中时常遇到的分布,通常是作为模型算法的一个中间部分。因其自身特点,在采样的时候,很容易得到取值非常大的样本点,从而导致算法发散。所以本篇简单介绍一下这个分布,并给出对其进行采样的策略。...原创 2022-07-20 05:26:35 · 592 阅读 · 0 评论 -
Deseq2的理论基础
Deseq2的理论基础原文:Moderated estimation of fold change and dispersion for RNA-seq data with Deseq2 by Love, Anders and Huber 2014这是对Deseq的延申,简单总结一下这个模型的统计方法。模型Number of reads in sample jjj that are assigned to gene iii记为KijK_{ij}Kij,假设Kij∼NB(μij,αi),i=1,原创 2022-03-04 04:05:58 · 495 阅读 · 0 评论 -
Deseq的理论基础
Deseq的理论基础原文:Differential Expression Analysis for Sequence Count Data by Anders and Huber 2010写篇博文简单总结一下这个模型的统计方法。首先,Deseq的目标是给定基因,检验不同组的read counts是否存在显著差别。如果reads是互相独立的,那么read counts服从二项分布,可以由Poisson分布近似(当the probability of read足够小,且样本数足够大时),所以Poisson分原创 2022-03-04 04:05:28 · 1490 阅读 · 0 评论 -
R语言应用统计1 主成分分析
R语言应用统计1 主成分分析这个系列就讨论应用基础,争取一条公式都不用写。当原始数据集比较庞大,并且不同变量之间存在一些相关性时,我们希望可以用更少的变量来表示原始数据集,用到的变量越少的同时,能够表示的原始数据集中的信息越多自然就更好。主成分分析就可以实现这样的目标,在主成分分析中用来表示原始数据集中的信息的变量被称为主成分。下面我们用一个例子说明R语言中进行简单的主成分分析的方法。数据使用HSAUR2包中的美国城市污染数据,代码如下install.packages("HSAUR2")data原创 2021-12-19 08:00:18 · 2998 阅读 · 0 评论 -
LASSO与Item Response Theory模型中的隐变量选择
LASSO与Item Response Theory模型中的隐变量选择Item Response Theory简介统计模型Latent Traits Selection两参数模型的LASSOBIC for tuningLatent traits selection的EM算法这是Latent Variable Selection for Multidimensional Item Response Theory Models via L1 Regularization的简单介绍。Item Respons原创 2021-06-11 06:16:15 · 358 阅读 · 0 评论