差异表达基因-火山图和聚类图解释

想研究某现象的分子机制,老板豪气的来一句,先测个转录组吧,看下差异表达基因。

是否在心里窃喜,制个样就完事了,太easy有木有。等大堆数据回来的时候,是不是傻眼了?

从何下手挑选差异表达基因呢?
今天就先来聊聊如何看差异表达基因数据,火山图,聚类图又怎么看1差异基因筛选方法那差异基因是如何筛选出来的呢?差异基因的筛选方法有很多,包括倍数法、T检验、F检验及SAM等
下面简单介绍一下GCBI平台上用的倍数法和SAM法。
倍数法适用于没有生物学重复的样本,其计算基因在两个条件下表达水平的比值,确定比值的阈值,将绝对值大于此阈值的基因判断为差异基因。
SAM算法适用于有生物学重复的样本,通过对分母增加一个常量 T 检验过程减小了假阳性发生的概率。文献中报道,相较于其他算法,SAM算法更为稳定,筛选出的结果也更为准确。2差异基因数据解读经过合适的差异基因方法筛选出的差异基因,结果一般分为两部分,数据+图形。
数据结果展示如下图所示(两分组)众多参数中,重点看三个。

p-value或q-value

没有做生物学重复请跳过这一步。
p-value或q-value是统计学检验变量,代表差异显著性,一般p-value或q-value小于0.05代表具有显著性差异,但可根据具体情况适当调整
因为p-value或q-value衡量地是某个基因假阳性的概率,如果p-value或q-value越低,那么挑选该基因出现假阳性的概率就越低,可验证性就越高。

两者具体的计算方法具体如下:那p-value、q-value同时存在时看哪个呢?

SAM法只有q-value当两者同时存在时,可根据具体情况具体分析。
差异筛选是一个典型的多重假设检验过程,对于多重假设检验,单次检验中差异显著基因的假阳性率(p-value较小)可能会较大,而q-value和FDR值较常见的BH校正方法得到的FDR值而言,改进了其对假阳性估计的保守性。
即q-value相比于p-value更加严格,当差异基因结果较少时,可以退而求其次看p-value。Fold ChangeFold Change表示实验组比上对照组的差异表达倍数,一般表达相差2倍以上是有意义的,放宽要求1.5倍或者1.2倍也可以接受。
看表达倍数的同时还需结合基因表达丰度,信号值太低的基因会在后续的验证实验中检测不到。3差异基因图表解读在差异结果的图形展示结果中,主要是火山图聚类图。火山图火山图只针对两分组且有生物学重复的情况。
如何看火山图呢?

火山图可反映总体基因的表达情况,横坐标代表log2(Fold Change),纵坐标表示-log10(P值),每个点代表一个基因,颜色用以区分基因是否差异表达,图中橙色的点代表差异表达基因,蓝色的点代表没有差异表达的基因。聚类图

聚类图可以衡量样本或基因之间表达的相似性
如上图所示的聚类图中,横坐标代表样本聚类,一列代表一个样本,聚类基于样本间基因表达的相似性,样本间基因表达越接近,靠的越近,以此类推。
纵坐标代表基因聚类,一行代表一个基因,聚类基于基因在样本中表达的相似性,基因在样本中表达越接近,靠的越近,以此类推。
色阶代表基因表达丰度,越红代表上调得越明显,越绿代表下调得越明显。
如何做聚类图请戳往期推送

做个聚类图只需1分钟
差异基因有了,如何挑选潜在基因进行实验验证呢?
关键还在于感兴趣点在哪了。粗略的看,可以先看KEGG或者GO功能分类,看差异基因具体富集在哪些通路或功能。
比如关注的是细胞内脂肪酸合成关键酶,可以重点看脂肪酸合成和碳流相关通路。具体如何看KEGG或者GO功能分类,请听下回分解。


参考

https://www.cnblogs.com/leezx/p/6601967.html


DrugAI
  • 11
    点赞
  • 103
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于MATLAB GUI的K-means算法聚类是一种常用的像处理技术,旨在将像中的像素点按照相似性进行分组。以下是一个300字的中文回答: K-means算法是一种无监督的机器学习算法,常用于聚类任务。MATLAB是一种强大的数学计算软件,提供了形用户界面(GUI)工具包,使得编写和运行K-means算法更加简单便捷。 要在MATLAB GUI中实现K-means聚类,可以按照以下步骤进行: 1. 数据准备:将要处理的像加载到MATLAB环境中,并将其转换为数字矩阵形式表示。可以使用imread函数读取像,并用rgb2gray函数将其转换为灰度像。 2. 初始化:选择要聚类的像素点数量,即确定聚类中心的数量。在GUI中,可以设置一个滑动条或者编辑框来动态调整聚类中心的数量。 3. 初始化聚类中心:使用随机或者其他策略选择初始聚类中心。可以使用randperm函数从像中随机选取K个像素点作为初始聚类中心。 4. 迭代计算:根据K-means算法的原理,对每个像素点计算其与每个聚类中心的距离,并将其分配到距离最近的聚类中心。然后,根据新的聚类结果重新计算聚类中心。 5. 结果展示:将聚类结果可视化展示出来。可以在GUI中添加一个像显示框,将不同聚类的像素点用不同颜色标记,形成聚类分割的效果。 在MATLAB GUI中实现K-means聚类,可以方便地调整参数和观察结果,提供了更好的交互性和可视化效果。通过这种方式,我们可以更好地理解和分析像数据,提取出像中的特定模式和信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值