01
—
简介
BiocManager是生物信息分析必不可少的R包之一,主要用来分析基因相关的各种问题,但是通常再R上安装这个程序包都挺麻烦的,搜索引擎上有非常多的关于如何安装的,因此这里只给个建议,R和RStudio都升级到最新包,目前R为4.0版本,具体的安装操作在下方官网中也有。http://bioconductor.org/
1.1、程序包安装
采用RStudio进行分析
安装过程中会同步安装几十上百个需要用到的其他的包,安装时间较长,并且经常报错!!!
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install()BiocManager::install(c("GenomicFeatures", "AnnotationDbi"))BiocManager::install(c("DOSE","topGO","clusterProfiler","DBI"))BiocManager::install(c("org.Hs.eg.db","pathview"))
1.2、调用程序
library(DOSE)library(org.Hs.eg.db)library(topGO)#画GO图library(clusterProfiler)#富集分析library(pathview)#看KEGG pathwaylibrary(xlsx)library(ggplot2)
1.3、加载数据
数据格式,一列Uniprot号或者基因名或者酶的名称都可以:
# 导入数据datadata$Uniprot
1.4、将基因名称进行互相转换
# 转换基因名keytypes(org.Hs.eg.db)#查看org.Hs.eg.db中含有的一些格式,共有26种ID = bitr(data$Uniprot, fromType="UNIPROT",#现有数据的格式 toType=c("ENSEMBL", "ENTREZID","SYMBOL","UNIGENE","GENENAME","ENZYME"),#转化的目标格式 OrgDb="org.Hs.eg.db")#利用org.Hs.eg.db库进行转化write.csv(ID,file="基因转化结果.csv")head(ID,10)#展示转化后的前10行结果