![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息统计学
文章平均质量分 75
luciferdfg
BIOINFORMATICS,
MACHINE LEARNING,
IMAGE PROCESSING
展开
-
limma 算法总结
我这个人完全没办法在不了解算法的情况下用一个包,那样我会疯,可是网上居然完全找不到limma算法的讲解资料,全是介绍怎么用的。可能我太初级了,这么简单的算法大概不值得一提……于是搞了一天原文,和东拼西凑的统计学知识,把现在了解的先总结一下:limma是做差异表达的包,其算法核心在两个function上:lmfit()以及eBays()lmfit()就是multiple linear regression假设我们有基因表达矩阵Y=[y1,y2,...y100]Y=[y_1,y_2,...y_{10原创 2021-04-29 20:30:49 · 6979 阅读 · 7 评论 -
史上最通俗易懂 pvalue
各种富集分析总是用到pvalue,而我的概率论知识和术语快忘完了,所以只能用小学生都能理解的方式和例子来重新缕一遍pvalue.承接上一篇文章:史上最通俗 Gene enrichment analysis 之 over representation analysis (ORA) 原理解释以上一篇的ORA为例。还是抽彩票问题。100张彩票中有10个有奖,如果我抽了20个,我想知道有4个彩票中奖这种情况有多稀有 。这个问题服从超几何分布。总体数量N = 100, 总体有奖彩票K = 10, 抽奖次数n=2原创 2021-04-16 22:13:10 · 2750 阅读 · 0 评论 -
史上最通俗 Gene enrichment analysis 之 over representation analysis (ORA) 原理解释
不把基因富集分析搞清楚不罢休,一直晕晕乎乎气死我了。1. 超几何分布根据维基百科,超几何分布描述了由有限个对象中抽出n个对象,成功抽出指定种类的对象的个数(抽出不放回 (without replacement))例如在有N个样本,其中K个是不及格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不及格的概率:道理都懂,但公式为啥长这样?举个简单通俗好理解的栗子:100张彩票中有10个有奖,如果我抽了20个,求有4个彩票中奖的概率,怎么求?高中知识:有4个彩票中奖,就是从10个中奖的彩票里原创 2021-04-14 05:28:04 · 3878 阅读 · 2 评论