蛋白质-蛋白质相互作用(protein-protein interaction, PPI)是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(protein complex)的过程。在进行数据挖掘的时候往往会得到很多的差异表达的基因,当你对着一堆基因毫无头绪时,此时PPI数据库对你的数据挖掘起了很大的助攻作用。
接下来,跟着小编一起来学习下PPI分析吧!文中附详细代码,小伙伴们可以使用自己项目数据,一步步复现下结果!
1 PPI分析的意义
系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。在生物医药领域有助于从系统的角度研究疾病分子机制、发现新药靶点等等。
接下来,小编具体讲解下基于STRING数据库,提取目标基因集的互作关系,构建蛋白互作关系,同时利用igraph和ggraph对互作网络进行可视化。对于数据库中未收录信息的物种,可以使用BLAST软件,将目的基因与数据库中的蛋白质进行序列比对,寻找同源蛋白,根据同源蛋白的互作关系对构建互作网络。构建完成的蛋白质互作网络大家也可尝试导入Cytoscape软件进行可视化。
2 创建STRINGdb对象
library(tidyverse)
library(clusterProfiler)
library(org.Hs.eg.db) 小鼠的话,把Hs改成Mm
library(STRINGdb)
library(igraph)
library(ggraph)
# 创建STRINGdb对象
string_db <- STRINGdb$new( version=