tcga数据下载_TCGA数据分析系列 蛋白相互作用网络

公众号“生信小课堂”

TCGA数据分析课程:生物信息学教学

我们的TCGA数据分析系列已经出过几期

TCGA数据分析系列(一)

TCGA数据分析系列(二):数据库之GEPIA2

TCGA数据分析系列(二):UALCAN数据库

TCGA数据分析系列(二):LinkedOmics

TCGA数据下载与ID转换

TCGA差异分析及ggplot作图验证

TCGA数据分析系列之火山图

之前我们已经得到了差异分析结果,接下来我们做差异基因的蛋白相互作用网络

v2-ac4d4a5c660451fbf0399dc2404d76ff_b.jpg

首先我们筛选adj.P.Val<0.01,logFC<-3和>3的基因,共有457个。接下来我们介绍两种方法进行蛋白相互作用网络的构建,并用cytoscape软件作图

1 Metascape数据库

http://metascape.org/gp/index.html#/main/step1

打开网站,将基因集复制进去

v2-4e4ef18b655a0d86912dceab9718845b_b.jpg

物种选择人,点击Expression Analysis

v2-3b9d16e16df744f0c5f9f92040d158f1_b.jpg

运行一会后,出现黄色按钮即可

v2-7f4ebbb74263c0c047796cc528d8b8d3_b.jpg

这个网站不仅可以做蛋白相互作用分析,还可以富集分析,点击All in One Zip File可以下载所有分析结果和图,这里展示了富集分析中P值最小的前20个,值得一提的是,这个网站的富集分析吧所有的项目放在一起作图,包括Canonical Pathways, CORUM,GO Biological Processes,KEGG Pathway,Reactome Gene Sets

v2-e6b4ee4f41b6daa83c1e9e8fdf5491c0_b.jpg

还有通路之间的网络关系

v2-0ee2f6975d55e87c1f0fc60798e2b09c_b.jpg

下面就是今天的主角,蛋白相互作用网络

v2-6a3db95b036d1da16eb1b4bc89a087b1_b.jpg

PPI网络默认用了MCODE算法来识别网络的关键亚集,很多人选择hub基因就是通过这个方法选择

另外每个MCODE亚集还有单独的富集分析结果显示,不过这个图是没有高清的图可以使用的。

v2-ee17a34994e7d561a4c87648623416d8_b.jpg

昨天组内课题汇报,也看到有人用这个网站做PPI分析,跟图里面一样,基因多的时候就都挤在一块了,那么有没有方法可以将图改变一下呢?

可以看到箭头指的方向可以下载CYS文件,而这个文件就是大名鼎鼎的可视化软件cytoscape的格式

v2-57f23ca5945670698af1b022604561c4_b.jpg

我们下载后打开是这个样子的(需要提前安装cytoscape软件,百度搜索官网下载即可)

v2-321ba466299ca1b63be6752d57ac9713_b.jpg

选中第一个MCODE,点击上面这个箭头所指的按钮

v2-5afd27591a92200659539113cd56d8f5_b.jpg

这样我们就吧MCODE1新开了一个界面

v2-feec1fa468b206ebe196fb5312bb7c06_b.jpg

如图所示,就可以用自带的显示方式来显示MCODE1

v2-7bacd47d805634daa0a6268fda7faa5f_b.jpg

字母被挡到了怎么办呢,选择Label Position可以进行调节

v2-44ccbdc76fb83b16da3e95ae7c16a905_b.jpg

全部都选Center

v2-ae28fdf5b9f8280ba1d8f9f370aa6e2e_b.jpg

出来是这个样子

v2-239b0bf65511d8027d7e8e553d70e25c_b.jpg

再调整字体大小

v2-8712922dce2c4f012851c79d2ecaef5f_b.jpg

这样就好看多了

v2-cc549868491ab4192d8d5e354182f1f1_b.jpg

然还有其他很多展示方式可以选择,比如Circular

v2-afdceaa94c8aa403e84a11ba1035476e_b.jpg

出来是这个效果,其实跟刚刚的图是一样的,只是半径变大了,半径可是可以设置的

v2-d68535904a84f6da22a4420c0d4b6f12_b.jpg

再比如Radial

v2-e5cefbfca59eb3e65be848c4e36100d1_b.jpg

出来是这个效果

v2-8df56ab5472a1503b7e23e1cb465271f_b.jpg

2 STRING数据库

https://string-db.org/

打开网站,输入基因集

v2-2391ee5edd1ee35c03fbaa099d755ce9_b.jpg

选择物种

v2-4fc5739bf60253576875f38e69dc53cf_b.jpg

继续

v2-f95741c7f8c06df10e153569463de7a2_b.jpg

出来的效果

v2-2700719278964ed7f567eaf73f572297_b.jpg

去掉没有连线的基因

v2-3793ae080b0046ca8f8f639dd7b982a7_b.jpg

得到下图

v2-f66ba29d145d1ceebe1b057720ac2ee9_b.jpg

下载TSV格式的文件

v2-dbe2295bdab97385eb23d4f42588612e_b.jpg

拖到cytoscape软件中

v2-459bf7002ade28485097096d01cfd71d_b.jpg

打开是这样的

v2-491daeb2a231a3d1c2469df1d7fa6705_b.jpg

然后经过一步步调整,利用到cytoHubba和MCODE这两个插件得到下面的几张图。(这个过程比较复杂,实在不适合用文字和图来描述。其实我也之前也录过视频,在公众号的在线课程中的TCGA数据分析大全中有,点击阅读原文可直达)

v2-f13cb76c249675854fd42170632405fd_b.jpg

v2-8ba6b713aec4221f908bb0ff2ad6a634_b.jpg

v2-b6ef41fc79fbf68a5513e100991018a3_b.jpg

好了,蛋白相互作用网络就分享到这了。

公众号“生信小课堂”

TCGA数据分析课程:生物信息学教学

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值