R语言与统计学(生物信息学)
文章平均质量分 74
楷然教你学生信
日常发布生信和R语言相关知识,适合临床医学,基础医学,生物信息学。
展开
-
(生物信息学)R语言与统计学入门(十)—— 多因素Cox回归分析
上次提到单因素cox回归分析:(生物信息学)R语言与统计学入门(九)—— 单因素cox回归分析_Lijingxian教你学生信的博客-CSDN博客_r语言单因素回归分析COX回归模型,又称“比例风险回归模型(proportional hazards model,简称Cox模型)”,是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于上述优良性质,该模原创 2022-05-07 01:00:00 · 9698 阅读 · 9 评论 -
(生物信息学)R语言与统计学入门(九)—— 单因素cox回归分析
COX回归模型,又称“比例风险回归模型(proportional hazards model,简称Cox模型)”,是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于上述优良性质,该模型自问世以来,在医学随访研究中得到广泛的应用,是迄今生存分析中应用最多的多因素分析方法。原创 2022-04-26 17:33:38 · 12456 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(八)—— logistic回归
线性回归模型是定量分析中最常用的统计分析方法, 但线性回归分析要求 响应变量是连续型变量. 在实际研究中, 尤其是在生物、医学、经济和社会数 据的统计分析中, 研究遇到非连续型的响应变量, 即分类响应变量....原创 2022-04-14 21:45:52 · 3101 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(七)—— 一元线性回归分析
我们之前讲过相关性分析,生物信息学常见的相关性分析是pearson相关和spearman相关。(生物信息学)R语言与统计学入门(六)—— Pearson和Spearman相关性分析_Lijingxian教你学生信的博客-CSDN博客但是相关性分析也有它的的缺点。相关分析只能得出两个变量之间是否相关, 但却不能回答在两个变量之间存在相关关系时, 它们之间是如何联系的, 即无法找出刻画它们之间因果关系的函数关系. 回归分析就可以解决这一问题, 先从一元线性回归讲起。设变量x和y...原创 2022-04-13 10:01:29 · 3245 阅读 · 1 评论 -
绘制一张好看的散点图及pearson和spearman相关性分析的选择
绘制一张好看的散点图及pearson和spearman相关性分析的选择原创 2022-04-09 13:23:51 · 9984 阅读 · 1 评论 -
(生物信息学)R语言与统计学入门(六)—— Pearson和Spearman相关性分析
相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。相关性分析主要包括pearson和spearman相关分析。比如比较两个基因之间的相关性,从而确定他们之间是否具有共表达关系。之前分享的关于GEPIA网站的两个基因相似性分析就是相关性分析:分享分原创 2022-04-08 01:42:11 · 8130 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(五)—— Wilcoxon秩和检验法和Mann-Whitney U检验
在正态总体的假定下, 两样本的均值检验通常用t检验。在零假设成立时服从自由度为n1+n2-2的t分布,和单样本情况一样,t检验并不稳健。在不知总体分布时,使用t检验可能有风险,因此考虑Wilcoxon秩和检验法。原创 2022-04-07 11:18:44 · 5371 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(四)——Fisher检验
费希尔精确概率检验(Fisher's precision probability test),亦称“四格表的确切概率法”。主要用于四格表资料各格中有一格理论次数小于 5 时的独立性检验的方法。原创 2022-03-30 04:00:00 · 6579 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(三)——卡方检验
卡方检验是用途很广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。卡方检验的适用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。在生物信息学中,什么时候用到卡方检验?例如:我们研究某个基因与患者临床的关系。基于基因的中位表达值将样本分成高低表达...原创 2022-03-29 02:00:00 · 1970 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(二)——单因素方差分析
上次说到t检验,是检验两组数据的均数差异,链接如下:(生物信息学)R语言与统计学入门(一)——t 检验_李京弦的博客-CSDN博客这次我们来介绍一下单因素方差分析。单因素方差分析:方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。简单地说,t检验比较的是两组均数,方差分析比较的就是三组。在生物信息学中常用于情况呢:比如临床分期,如下图:假设我们找到一个基...原创 2022-03-22 00:37:26 · 1574 阅读 · 0 评论 -
(生物信息学)R语言与统计学入门(一)——t 检验
t检验,亦称student t检验(Student's t test),比较两个平均数的差异是否显著。原创 2022-03-17 17:01:28 · 2633 阅读 · 1 评论