linux下的go富集分析,GO富集分析(转载)-Go语言中文社区

本文详细介绍了GO富集分析的基本概念、GO功能分类、为何进行基因富集分析及其步骤,包括GO分析、Pathway分析和基因网络分析。通过实例展示了如何在Linux环境下使用GO官网工具进行GO slimmer和Enrichment analysis,以帮助研究人员发现基因集的共性和潜在功能。
摘要由CSDN通过智能技术生成

GO富集介绍

每个基因都会对应有一个或多个GO term(也就是GO功能)。

富集涉及到两个概念:前景基因和背景基因。前景基因就是你关注的要重点研究的基因集,背景基因就是所有的基因集。比如做两个样本对照组和处理组的转录组测序,前景基因就是对照组vs处理组的差异基因,背景基因就是这两组样本的所有表达基因。再比如,我想知道与整个广东省相比,深圳市的大学生是不是显著更多(“大学生”就相当于深圳市民的其中一个GO term)。那么前景就是深圳市的人口,背景就是广东省的人口,每个个体都会有一个标签(如大学生、中学生、小学生等)。

具体介绍:

Gene Ontology分为分子功能,生物过程和细胞组成三个部分。蛋白质或者基因可以通过ID对应或者序列注释的方法找到与之对应的GO号,而GO号可对应到Term,即功能类别或者细胞定位。这也是GO富集的一个基础。

概念明晰:

功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显著富集的GO Term。该功能或者定位有可能与研究的目的有关。

GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO的第二层次。此外也有研究者挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。结果一般以柱状图或者饼图表

为什么做基因富集分析?

我们在得到相关基因的表达后,做基因差异分析得到了好多差异基因(p值小的,也就是差异很显著的基因),做后续研究时不可能将所有差异基因都拿来做实验验证或者拿出来说明问题,这时候就需要挑选了,那怎么挑选呢?或者说拿什么标准来衡量我挑选的基因是否可信,有一个统一的挑选标准吗?

这就是富集分析需要做的,能够给出的结果。

富集分析一般包括以下步骤:

1.GO分析

根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO 返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。

GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。

2.Pathway分析

根据挑选出的

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值