Kegg通路或者GO本体论富集分析是基因功能注释最常见的分析,结果可以以多种形式展示,最常用的包括:条形图/bar图,气泡图/dot图等,其中气泡图输入数据一般包括以下4个维度的信息:
名字,富集倍数(或者gene ratio),P值,基因count。
例如:
pathway | enrichment | pvalue | count |
RNA transport | 4.807258641 | 1.56E-05 | 15 |
Epstein-Barr virus infection | 4.569261748 | 2.70E-05 | 16 |
HTLV-I infection | 3.814616521 | 0.000153244 | 17 |
Tuberculosis | 3.454180941 | 0.000351414 | 13 |
MAPK signaling pathway | 3.378131581 | 0.000418667 | 16 |
Neurotrophin signaling pathway | 3.212102971 | 0.000613617 | 10 |
Long-term potentiation | 3.000035266 | 0.000999919 | 7 |
Dopaminergic synapse | 2.967026455 | 0.001078881 | 10 |
Endocytosis | 2.841316731 | 0.001441064 | 15 |
Herpes simplex infection | 2.775219173 | 0.001677957 | 12 |
4维分析结果
做出来的例图如下(微生信平台免费在线做气泡图)
富集气泡图
该图包含的4维信息有:
- Y轴的通路名(pathway,结果表格的第一列)
- X轴的富集倍数(enrichment,结果表格的第二列)
- 点的颜色(P值,结果表格的第三列)
- 点的大小(count,该通路中包含的基因与输入基因列表交集的基因数)。
其中基因的信息就丢失了,那么我们能否将基因的信息也加入到图中呢?答案是肯定的!
让我们先来看看5维的分析结果,以clusterProfiler结果为例:
Description | GeneRatio | pvalue | geneID | Count |
Circadian rhythm | 0.014085 | 0.010497623 | RORA/RORB | 2 |
NOD-like receptor signaling pathway | 0.028169 | 0.03303255 | CASP8/TRIP6/MAPK8/CASP1 | 4 |
PPAR signaling pathway | 0.028169 | 0.008761306 | CD36/AQP7/LPL/CYP4A11 | 4 |
Viral myocarditis | 0.028169 | 0.009484362 | CASP8/MYH7/SGCB/SGCD | 4 |
Hypertrophic cardiomyopathy (HCM) | 0.042254 | 0.014532337 | MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A1 | 6 |
Dilated cardiomyopathy | 0.042254 | 0.020924238 | MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A1 | 6 |
Osteoclast differentiation | 0.049296 | 0.034284302 | LILRB5/MAPK8/FHL2/FCGR1A/IFNGR2/FOS/LILRB3 | 7 |
Phagosome | 0.049296 | 0.018180176 | TUBA3D/THBS4/SFTPD/CD36/FCGR1A/TUBA3E/DYNC1I1 | 7 |
Huntington's disease | 0.056338 | 0.001736229 | TBPL1/CASP8/VDAC3/CREB5/PPID/CLTB/NDUFA12/GRIN2B | 8 |
5
根据这里的基因,我们可以在气泡图的基础上,添加一个基因维度,列出基因名字。若下图所示(瞬间眼前一亮有没有)
升级版的5维富集气泡图
该图左侧为基因,右侧为常规的气泡图。
包含的5维信息有:
- Y轴的通路名(pathway,结果表格的第一列)
- X轴的基因ratio(gene ratio,结果表格的第二列)
- 点的颜色(P值,结果表格的第三列)
- 基因名字(结果表格的第四列,图中左侧的桑吉图,连线表示隶属关系)
- 点的大小(count,结果表格的第五列)
秉承一贯简洁的作用,微生信平台支持直接输入数据,就可以做出来这张桑吉气泡图,尝鲜版,赶紧试试吧!
微生信云平台(http://www.bioinformatics.com.cn)以在线作图、在线数据分析为基本方式,致力于0代码分析科研数据,0代码展示数据结果,帮助生命科学、医学等领域的科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,辅助科研,促进知识传播。
平台以110多款在线作图/分析模块为依托,汇聚了国内外超过16000名生命科学等领域的注册用户。在这里,您可以:
- 零代码在线调用100多种分析模块(持续努力编写中)
- 零代码在线绘制110+款科研图片(已完成100多种)
微生信 -- 全天候满足您的非分之想,赶紧微信扫描添加我们吧!