利用Annotationhub时候,下载老中断怎么办?

我们在使用annotationhub对RNAseq差异表达基因进行注释的时候,往往遇到了如下的问题:

> query(ah, "Oryza sativa") ##查找目标物种
AnnotationHub with 4 records
# snapshotDate(): 2019-10-29 
# $dataprovider: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/, Inparanoid8
# $species: Oryza sativa_subsp._japonica, Oryza sativa_Japonica_Group, Oryza sativa_(japonica_cu...
# $rdataclass: OrgDb, Inparanoid8Db
# additional mcols(): taxonomyid, genome, description, coordinate_1_based, maintainer,
#   rdatadateadded, preparerclass, tags, rdatapath, sourceurl, sourcetype 
# retrieve records with, e.g., 'object[["AH10561"]]' 

            title                                               
  AH10561 | hom.Oryza_sativa.inp8.sqlite                        
  AH75915 | org.Oryza_sativa_(japonica_cultivar-group).eg.sqlite
  AH75916 | org.Oryza_sativa_Japonica_Group.eg.sqlite           
  AH75917 | org.Oryza_sativa_subsp._japonica.eg.sqlite    

获取数据库名字这一步没有问题,但是下载就没那么容易了。

常见的两种错误如下:

> tar_org <- ah[["AH10561"]] ##下载目标物种到org数据
downloading 1 resources
retrieving 1 resource
  |                                                                                          |   0%


> tar_org <- ah[["AH75917"]] ##下载目标物种到org数据
loading from cache
错误: failed to load resource
  name: AH75917
  title: org.Oryza_sativa_subsp._japonica.eg.sqlite
  reason: database disk image is malformed
此外: Warning messages:
1: Couldn't set cache size: database disk image is malformed
Use `cache_size` = NULL to turn off this warning. 
2: Couldn't set synchronous mode: database disk image is malformed
Use `synchronous` = NULL to turn off this warning. 

 

下载注释数据库有问题,我尝试了很多次,最终拟出了一个解决办法

我们以水稻注释数据库为例,

①首先从annotationhub网站上下载注释sqlite文件http://s3.amazonaws.com/annotationhub/ncbi/uniprot/3.10/org.Oryza_sativa_subsp._japonica.eg.sqlite

②下载好的org.Oryza_sativa_subsp._japonica.eg.sqlite放在C:/Users/Administrator/AppData/Local/AnnotationHub/AnnotationHub/Cache/目录下

开始手动导入

library(AnnotationDbi)  
# 导入本地数据库包
riceorg <- loadDb("C:/Users/Administrator/AppData/Local/AnnotationHub/AnnotationHub/Cache/org.Oryza_sativa_subsp._japonica.eg.sqlite")
keyunis <- head( keys(txdb, keytype="GENENAME") )
keytypes(riceorg)  # 查看这个数据库中有哪几种keytypes。

# 提取前20个key并根据它们把信息提取到ZHUSHI这个变量中,输出到zhushi.csv中。

keys=keys(riceorg)[1:20] 
ZHUSHI=select(riceorg, keys=keys, columns = c("SYMBOL","REFSEQ","GENENAME","ONTOLOGYALL","GOALL","ACCNUM"))
write.csv(ZHUSHI,file="zhushi.csv")

 

大家想要进行kegg和GO注释的话,调用riceorg就好啦~


 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值