go 读取文件最后几行_无代码GO富集弦图绘制总结

基因本体(Gene ontology,GO)分析在生物信息学领域中广泛使用,包括细胞组分(Cellular component)、分子功能(Molecular function)与生物过程(Biological process)。

文献中通常使用柱形图或点图来展示GO富集分析结果:

8b2648ef22e03f080caeec7103258a42.png

柱形图或点图只能突出展示富集率而不能展示蛋白和通路的关系以及指示通路功能强弱的变化。

如何对GO分析结果进行全面而详细的可视化仍然是一种挑战!

2015 年Wencke Walter等在Bioinformatics发表了一个基于ggplot2的R包——GO plot(http://wencke.github.io/),文章发表以来引用次数高达127次。

GO plot可以得到包括气泡图、弦图(chord plot)在内的高级GO富集可视化图形,科学家只需几行代码就可以生成有洞察力的图形!

fd385fb1ec4962b482745195373d4e1f.png

下面以GO富集弦图为例来解读其所展示的含义:

b58a2ae831fec1b0d8d62c520059df79.png

GO富集弦图即显示了参与GO term的基因有哪些;还按照变化倍数对上调/下调蛋白进行了排序;还能够显示到底是哪些蛋白参与了何种GO term;并将GO富集分析的term按照强弱进行了排序。

GO富集弦图可以反应全面详细的数据信息,提高文章图片档次!

那么问题来了,不会R语言的小白该如何进行GO分析?如何绘制GO富集弦图呢?

Metascape进行富集分析

Metascape网址:http://metascape.org/gp/其界面如下:

d59efdb6d744a2dc7e46f7439605f2de.png

Metascape可提交单个或多个基因序列,可提交xlsx、csv与txt格式文件,也可以直接进行粘贴。我们选择直接粘贴基因序列:

74dc9b840f74e3209149311c10c11376.png

待分析完成后打开Analysis reporte page,此报告页面可在72小时内访问:

302cdb0454195e1478f0e186ade2052a.png

可以得到的结果:

(1)富集条形图(Bar graph of enriched terms)

91a39995f2684c5b964ef9d6b1c26b5d.png

图片可以保存也可以点击PDF图标可保存为pdf文件。

(2)输入基因列表的统计数据

29895a094d0bf7d6f002090ea2afffec.png

(3)Enriched term网络

38d262fe1f9f7f609c0c6c988e288d04.png

可导出Cytoscape(官网http://www.cytoscape.org/)可以编辑的CYS文件、PDF文件与在线打开,点击Web在线打开网络:

88c1d1db507e701d55befad4e95a7761.png

GO network显示模式有三种:Color by cluster,即根据聚类的簇显示颜色、Color by p value,即颜色由p值决定与Default默认单一颜色:

0e4d183785dcea9ed006cf2d855a3c29.png

Layout的模式有3种:

ac40f8a35029de091482150f8c83756b.png

鼠标点击节点可以显示节点信息:

bc4846f1c85ebafa05ca50ce01466619.png

鼠标选中节点可拖动节点至任意位置:

429b17fdc319f3860fe689edb4c39721.png

Enriched term网络右侧工具分别为:

219b82512f530ecda99078e1f1bdb080.png

选中1个或多个节点,点击Show/Hide Table可显示节点信息:

0f01a41fabed0b1f99e4f0ededcd2607.png

从表格中可以得到很多信息,例如Fgg、Kng2与Fga参与了GO Biological process中的negative regulation of blood coagulation,其LogP约为-3.97:

7c509c8bfff31025b6855a3ee1c83f7e.png

(4)蛋白质相互作用富集分析

4f883ddb6d1256bafdb537e87193eee0.png

对于每个给定的基因列表,利用BioGrid6数据库进行了蛋白质-蛋白质相互作用富集分析。

得到的网络包含与列表中至少一个其他成员形成物理相互作用的蛋白质子集。

如果网络包含3到500个蛋白质,则应用MCODE7算法来识别紧密连接的网络。

导出分析结果:

ff8f1284d37daf4c1c0846cef155693c.png

选择All in One Zip File:

bdf92d271880e321252a1f3f5032b423.png

打开metascape_result Excel文件可得到基因注释与富集情况,可得到哪些基因参与了何种生物过程,还能根据p值对富集生物过程强弱的变化进行排序:

cc21460df224d04a90f6b13109737ab3.png

无代码GO富集弦图绘制

工具:微生信网站

步骤:

1.打开GO富集弦图绘图模块:

b5c82a4076158a10a0ab9c1b24cf5d48.png

2.按照右侧绘图即数据格式说明准备数据:

d09db33b3c89443dba60dbf463ca6c0b.png

metascape_result文件中找到GO富集注释信息:

7ac4694953d7e0aa6d6f0ec086d5f5b4.png

调整数据为右侧要求格式,即第一列是基因,最后一列是logFC,其余列是GO term,1表示该基因在这个GO term中,0表示不在:

bc525d90e99a776749f95aa8a6204d8e.png

输入数据,设置图片宽、高与文字大小,排序选择logFC:

4b2d76940da9eae1d6392a8a48a21e8a.png

点击提交得到炫目多彩的GO富集弦图:

c0eeabd281be208133f6ab4f6885b793.png

在生成的图上点击鼠标右键,在弹出的窗口中选择另存为(直接是svg格式文件,文件后缀不用改),若不行请换浏览器,推荐chrome。

3631854d671d7bd853f30aacc57f5778.png

如何修改图片,以满足杂志需求?

默认Arial字体,可下载Inkscape软件,或者Acrobat IIustrator (AI)、PS软件,打开下载的svg文件,修改文字,布局等后,导出高分辨率出版级矢量图,例如pdf。

扩展

Cytoscape进行富集分析

Cytoscape官网:http://www.cytoscape.org/

下载安装Cytoscape后Apps -> App manager安装BiNGO插件。

Cytoscape -> Apps -> BiNGO打开插件:

ca45b539cd1de94c7e3cdd1d8afef287.png

输入数据,设置参数:

1ccc7260bfee579176015ec50706af2b.png

得到分析结果:

f9d8d6c7e51443e0528194aca4f7a712.png

56fbc770c97f355bddcacb96c352ab21.png

其他富集分析

1.David (https://david.ncifcrf.gov/home.jsp)

08646d29bcccfaaec9bb229fdb546327.png

2.Gene Ontology Consortium(http://geneontology.org/)

ceed7d6b52732ea4947fcb27677abc3f.png

3.Webgenstal(http://www.webgestalt.org/)

e81f8d7b53fb46bf26e3422e8a12518b.png

弦图除了可以用来绘制GO富集分析结果还可以用来绘制KEGG pathway结果。

本文首发于“ 解螺旋精选”微信公众号

转载请注明:解螺旋·临床医生科研成长平台。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值