富集分析是将基因根据先验的知识(也就是常见的注释)进行分类的过程,最常见的富集分析是GO与KEGG富集。
文献中通常使用柱形图或点图来展示富集分析结果,柱子的高低与p value相关,柱子越高则富集越显著:
柱形图只能突出显示富集的Term与对应的p值,存在一定的局限性。
因此,在一些高分文献中则会使用更高效的气泡图(Bubble图)来展示富集分析结果。
富集分析气泡图是在笛卡尔坐标系中加入数量、p值等参数表示三个变量关系的图形。
下图是2020年2月26日发表的Cell文献【1】的富集分析气泡图:
气泡图相较柱形图的优点是可以显示更加全面而详细的可视化富集分析结果:即显示参与富集通路的差异表达基因数量与对应的p值。
R语言ggplot2可以方便的绘制富集分析气泡图,那么不会编程的医学生该如何实现富集分析气泡图的绘制呢?
GO富集分析气泡图绘制
1. Metascape进行富集分析
Metascape是一个操作简单、功能强大的在线基因功能注释分析工具【2】,网址为:http://metascape.org/gp/ 。
在Metascape主界面依次提交差异基因序列、选择物种为H. sapiens、Express Analysis:
点击Gene List Report Excel Sheets下载分析报告:
得到富集分析结果,其中LogP为Log10(p-value),InTerm_InList为参与注释Term的基因与该Term包含的总基因数,Symbols为在对应Term富集的具体基因:
2. 绘制GO富集分析气泡图
微生信是一个免费在线生物信息学数据可视化工具,目前能做文献中常见的50多种生信相关矢量图,其网址为:http://www.bioinformatics.com.cn/ 。
(1)数据准备
打开微生信下富集气泡图模块(最新添加),查看绘图数据要求:
对于GO富集分析,Y轴为富集Term名称,X轴为Rich factor(参与Term基因与该Term总基因数的比值),大小为基因个数、颜色为p值大小。
选择InTerm_InList列数据,点击数据 -> 分列:
选择固定分隔符号/分列:
两列相除计算Rich factor:
因为Metascape导出数据中LogP为Log10(p-value),需使用10^(LogP)函数计算p值:
由此获得符号绘图要求的数据如下:
(2)绘制富集分析气泡图
输入准备好的GO富集分析数据,设置参数,X轴说明为Rich factor:
排序方式有以下几种,选择按照p值排序:
得到富集气泡图:
(3)导出图片
在生成图片界面右击,将图片另存为选择.svg可导出矢量图:
其他在线工具
1. Aipufu免费综合生信平台绘制富集分析气泡图
网址:http://www.aipufu.com
选择绘制富集气泡图:
查看示例数据格式,输入数据:
点击立即运行,得到结果,标注文字是固定的,如需更改使用PS更改即可:
右击,将图片另存为……可保存矢量图:
2. David与KOBAS联用进行富集分析
David是常用的在线富集分析网站,网址为:https://david.ncifcrf.gov/home.jsp ,
KOBAS可用于GO和KEGG pathway分析,网址为:http://kobas.cbi.pku.edu.cn/kobas3 。
步骤:
(1)打开DAVID网站,点击Start Analysis:
(2)输入差异基因,在Select Identifier中选择Official_gene_symbol,然后在List Type中选择Gene List,最后点击Submit List:
(3)挑选研究的物种,示例物种为Homo Sapiens:
(4)后续的富集分析需要使用gene ID,因此需进行基因名到基因ID的转换,点击Shortcut To DAVID Tools,选择Gene ID Conversion:
得到结果:
(5)将基因ID输入KOBAS网站,点击Gene List Enrichment,后续根据研究对象类型,进行相应选择。随后将前面获得的ID粘贴下来,放进Input框中:
选择KEGG Pathway与GO,点击Run:
得到富集结果后续可进行气泡图绘制:
Origin绘制富集分析气泡图
Metascape得到的数据使用Origin绘制富集分析气泡图:
步骤:
(1) 打开Origin,输入富集分析数据:
(2) 选择前三列,Plot -> Basic 2D下选择Color Mapped Bubble:
得到基本气泡图:
(3) 双击坐标轴,Line and Ticks下设置Top与Right框线:
双击图形,设置绘图区背景色为LT Gray,透明度为86%:
效果如下:
双击坐标轴,Grid处设置网格线为白色,宽度为2:
(4) 设置气泡大小
双击气泡,设置Symbol为实心圆,Size由D列决定,Scaling Factor为2:
此时参与Term基因数越多,气泡越大:
(5)设置气泡颜色由-log10P决定
双击气泡,Symbol Color选择由C列决定:
设置Color Palettes颜色为绿到红色(可自行选择):
效果如下:
(6)添加图例
添加Bubble scale:
添加Bubble scale上方添加Color Scale:
最终效果如下:
(7)File -> Export Graph导出图片(快捷键Ctrl+G),可设置导出图片格式、宽、高与分辨率等:
在线工具绘制富集分析气泡图相比Origin软件更加简便,无需安装软件,任意一台联网的电脑足以实现富集分析气泡图的绘制,希望对大家有所帮助!
参考文献:
1. Ma S, Sun S, Geng L, et al. Caloric Restriction Reprograms the Single-Cell Transcriptional Landscape of Rattus Norvegicus Aging. Cell. 2020;180(5):984–1001.e22.
2. Zhou Y, Zhou B, Pache L, et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nat Commun. 2019;10(1):1523.
本文首发于“解螺旋”微信公众号
转载请注明:解螺旋·临床医生科研成长平台