使用 bioMart 包获取数据库信息

使用 bioMart 包获取数据库信息

通过 R 包获取数据库中的信息, 该数据库包括一下内容

以下内容参考网址1

1.查找某个基因在染色体上的位置。反之,给定染色体每一区间,返回该区间的基因;

2.通过EntrezGene的ID查找到相关序列的GO注释。反之,给定相关的GO注释,获取相关的EntrezGene的ID;

3.通过EntrezGene的ID查找到相关序列的上游100bp序列(可能包含启动子等调控元件);

4.查找人类染色体上每一段区域中已知的SNPs;

5.给定一组的序列ID,获得其中具体的序列;

Step.01 Install Package

BiocManager::install("biomaRt")
install.packages('curl')

Step.02 Show Database

library("biomaRt")
library('curl')
listMarts()

Step.03 View Abstract

my_mart=useMart('ensembl')
dataset = listDatasets(my_mart)
grep('mm',dataset[,1],value = T)

Step.04 Choose species

mart <- useMart("ensembl","hsapiens_gene_ensembl")
##人类'hsapiens_gene_ensembl'
##小鼠'mmusculus_gene_ensembl'

Check input types

转换前的ID类型,如:

ENSG00000000003或ENMUSG000000003,属于类型为ensembl_gene_id;
ENST00000000233或ENMUST00000000233,属于类型为ensembl_transcript_id;
102178245,属于类型为entrezgene;
Hoxc13,属于类型为external_gene_name;
NM_000014,属于类型为refseq_mrna;
hsa-let-7a-1,属于类型为mirbase_id;

用listFilters()函数查看可选择的输入类型

Step.05 Use listAttributes check output types

要想知道biomaRt支持哪些ID类型的输出,可以通过以下命令查看,共支持3607种ID输出,这里只截取了一部分输出,一共有name和description两列

listAttributes(mart)

Step.06 getBM()

hg_symbols<- getBM(attributes=c('ensembl_gene_id','hgnc_symbol',"chromosome_name", "start_position","end_position", "band"), filters= 'ensembl_gene_id', gene = my_ensembl_gene_id, mart = mart)

这个函数有4个参数

attributers()里面的值为我们输出的ID类型
filters()里面的值为我们输入的ID类型
gene= 这个值就是我们要输入的数据
mart= 这个值是我们所选定的数据库的基因组

Step.07 Practice

setwd("C:/Users/Desktop/circRNA分析结果/find_circ_result自己分析结果")#设置working directory
gene_symbol<-read.csv("SFTSV_24vscontrol_circBase_anno.csv",header=F,stringsAsFactors = F)[,11]#读取数据并提取含有gene_symbol的列
library(biomaRt)
mart <- useMart("ensembl","hsapiens_gene_ensembl")##小鼠选择mmusculus_gene_ensembl
gene_id<-getBM(attributes=c("external_gene_name","ensembl_gene_id"),filters = "external_gene_name",values = gene_symbol, mart = mart)#将输入的filters设置未external_gene_name(也就是gene_symbol),将输出的attributes设置为external_gene_name和emsembl_gene_id
write.table(gene_id,"SFTSV_24vscontrol_circBase_anno_gene_id.txt",row.names = F,col.names=F,quote=F)

  1. https://www.cnblogs.com/yanjiamin/p/12054879.html ↩︎

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值