差异分析
文章平均质量分 84
生信小博士
本人声明2024年之前的内容非本人原创,仅作为记录本人的学习过程的一个平台,当时声明原创是由于平台自动默认,刚使用这个平台不太清楚,现在很多文章找不到原文链接,批量修改过于复杂,如有内容不适合发表在本博客上,对您造成影响,请及时联系我删除该内容或在文章下方声明是您的原创,不甚感激。2024年的内容为本人原创如有兴趣,可关注了解。
展开
-
评分addmodule 绝对值评分 8种方法可视化你的单细胞基因集打分gsea 缺氧评分
简单地为多种基因集富集分析方法的结果取共同交集,不仅容易得到少而保守的结果,而且忽略了富集分析方法中很多的其他信息,例如不同基因集的相对富集程度信息。偶尔逛朋友圈发现一年前跟着我们生信技能树学生信的研究生开发了自己的单细胞数据分析相关R包,4(热图,气泡图,upset图,堆叠条形图)+4(密度散点图,半小提琴,山峦图,密度热图)美图吸引了我的注意力,果断邀稿,希望可以介绍他的R包使用方法,以及开发新的体会!山峦图中上方的核密度曲线展示了数据的主要分布,下方的条形编码图展示了细胞亚群具体的数量。原创 2022-10-25 11:27:20 · 5501 阅读 · 0 评论 -
GSVA和生存分析
我们生信技能树B站又免费悄咪咪的上线了一个GSVA生存分析教学视频,然后学徒马上就学习了,居然是主动学习的,让我喜出望外!(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称。前面在下载gmt数据那里做了两次,第一次在上面已经讲解了,下面是第二次的探索过程,第二次会总结第一次的错误。最近跟着Jimmy老师的视频,学习用GSVA做生存分析,反反复复做了几次都无法复现作者的结果。原创 2022-10-18 13:59:43 · 2269 阅读 · 0 评论 -
limma 包的normalizeBetweenArrays和其他数据矫正方法removeBatchEffect
如果你仅仅是做了两个单细胞转录组样品,想合并这两个数据再后续分析,就面临着两个样品(处理前后的生物学差异)本身的批次效应(不同时间点取样,不同10x上机时间等等)。因为是单细胞,一个样品里面本身就有这成千上万个细胞,可以针对两个样品内部的某些具有不变属性的单细胞来作为锚定,从而比较好的合并两个样品的单细胞转录组数据。可以看到,两个分组是泾渭分明的,这可能是生物学差异,因为肿瘤样品就肯定跟正常组织不一样的啊,也有可能是批次效应。,但那样的去除是针对生物学差异与批次效应交叉的情况来去除。原创 2022-10-14 14:31:10 · 3883 阅读 · 0 评论 -
基因表达量高低分组的cox和连续变量cox回归计算的HR值差异太大? km cox生存分析 多因素生存分析
现在有了《专辑》这个功能,其实更方便查看我们的历史教程啦。因为我五年前做生存分析研发这个代码的时候,就是根据基因表达量,把病人分成了高低表达两个组,不管是使用cox还是km,都是这样做的。但是最近有学生反映,使用cox还是km拿到的基因的生存效果是一致的, 就是风险因子和保护因子的分类问题。主要是靠HR值来判断咯。原创 2022-10-12 22:29:05 · 2776 阅读 · 0 评论 -
WGCNA那么多图,都啥意思? 官网
需要注意的是,grey模块中包含了所有未参与聚类的基因,因此是无效模块,不应用于后续分析。之后针对关键模块brown和感兴趣的性状weight进一步挖掘,看看基因与模块的相关性(Module Membership, MM)和基因与性状的相关性(Gene Significance, GS)之间是否有某种关联。这个图可以分为两部分看:上半部分是基因的层次聚类树状图,下半部分是基因模块,也就是网络模块。通过以上散点图,可以发现MM和GS呈正相关,说明这些与性状高度相关的基因,在关键模块中也扮演着举足轻重的角色。原创 2022-10-11 23:47:59 · 1887 阅读 · 0 评论 -
GEOquery只下载临床信息如何只查看geo的临床信息而不下载矩阵
找到想要进行分析的数据之后第一件事可能就是获取临床信息表了,例如,我要是用GSE42568进行分析,打开GEO官网你就会发现没有地方可以下载临床信息表。GEO只提供3种格式的数据: 。如何得到这种类型的临床信息表呢?往往大家都是各显神通,有用excel处理的、有写编程处理的,反正不是特别简单。这三种格式都是临床信息表与表达谱交杂在一起的。行名不是指标的名称,而是十分诡异的!链接:https://zhuanlan.zhihu.com/p/393688973。这显然不是我们需要的临床信息表。原创 2022-10-11 23:43:09 · 2044 阅读 · 1 评论 -
芯片数据的差异分析主要包括三种方法 ANCOVA进行差异分析 为何不用deseq2
它是一个功能比较全的包,既含有cDNA芯片的RAW data输入、前处理(归一化)功能,同时也有差异化基因分析的“线性”算法(limma: Linear Models for Microarray Data),特别是对于“多因素实验(multifactor designed experiment)”。这时候edgeR依然可以用,不过需要认为指定一个dispersion值,这样的不同的人就可以有不同的结果,在查阅了很多资料之后呢,大家一致认为没有重复的转录组数据应该用GFOLD软件。原创 2022-10-10 16:52:50 · 1044 阅读 · 0 评论 -
limma差异分析input输入数据格式
大家都知道芯片数据跟RNA-seq数据的本质就是value的分布不一样,所以各种针对RNA-seq的差异分析包也就是提出来一个新的normalization方法而已。大家都知道,这十几年来最流行的差异分析软件就是R的limma包了,但是它以前只支持microarray的表达数据。用法与limma一模一样的,只是多了一个normalization而已。而我们limma本身就提出了一个。原创 2022-10-10 16:52:19 · 693 阅读 · 0 评论 -
An Introduction to ANCOVA (Analysis of Variance) 协方差分析 看某个treatment排除其他因素后对结果是否有显著性影响
To identify molecular profiles associated with clinically defined subtypes of IPF/UIP, we used an ANCOVA model that incorporates disease status, age, gender and smoking status as factors.原创 2022-10-10 10:22:52 · 490 阅读 · 0 评论 -
Analyzing RNA-seq data with DESeq2 deseq2官网 必须使用原始数据 raw_counts
【代码】Analyzing RNA-seq data with DESeq2 deseq2官网 必须使用原始数据 raw_counts。原创 2022-10-10 00:06:39 · 384 阅读 · 0 评论