基因富集分析是在一组基因中找到具有一定基因功能特征和生物过程的基因集的分析方法,在研究差异表达基因、筛选基因的后续分析中经常使用。富集分析能够发现在生物学过程中起关键作用的生物通路, 并且帮助理解生物学过程的分子机制。它是快速调查目标基因集功能倾向性的方法之一。
进行基因功能富集的网站很多,下面我们先介绍其中一个,叫DAVID。
我们可以用谷歌搜索一下,谷歌搜索比较快:
此网站是持续更新的。
下面我们直接分析,点击start analysis。
首先需要上传基因:
我们随意上传一组Excel里面的基因试试,直接Excel复制粘贴上去:
传入基因以后,第二部选择OFFICIAL_GENE_SYMBOL,第2a步选择Homo sapiens,第三步选择Gene list。
然后点击Submit List:
点击功能富集工具分析:
这是我们要看的基因本体论和通路,我们点开基因本体论看一看:
主要选择红色的,BP是生物过程,CC是细胞组分,MF是分子功能。
点击BP后面的chart看一看:
可以看到我上传的这一串基因主要富集到线粒体自噬,自噬小体组装等生物学过程。
下面,我们要点击右上脚下载:
此刻出现如下界面,Ctrl+A全选,Ctrl+C复制:
桌面上或者文件夹中新建一个txt文本文档,注意一定是txt文本文档,不然后续没法用:
把数据粘贴上去,然后保存。
此时我们用excel打开:
可以看到每一个生物学过程富集的基因,P值,以及FDR错误发现率。
那么我们后续就可以用这些数据作图了。