每一个微生物学组的研究者在分析数据的时候都会遇上各种数据的问题:做16S分析发现数据库定制格式不会,做宏基因组有参分析发现依赖数据无法下载,宏基因组注释分析时用的NT,NR数据库从NCBI下载太慢了,建软件索引时计算资源不足,甚至要担心有一天国际数据库切断了,我们该从哪里下载数据?
此外,还很多软件依赖的数据库下载缓慢、甚至保存于Google、Dropbox等平台国内下载困难。现在福音来了,宏基因组公众号联手中科院微生物学科数据中心打造的微生物组“工具和资源下载”(http://nmdc.cn/datadownload)专栏上线了,一站式解决本领域常用软件和数据库的下载问题。
现在,这些问题都可以在国家微生物科学数据中心(NMDC)解决了。NMDC为大家精心整理了7个类别的62个数据库100TB的数据,还包括做微生物组软件流程(易扩增子、R包合辑)、扩增子常用数据库(QIIME/USEARCH的使用的GG/RDP/SILVA/UNITE)、宏基因组软件常用参考数据库(KneadData、HUMAnN2/3、Kraken 2、MetaWRAP、GTDB、eggNOG、CAZy),都可以通过国家微生物科学数据中心的云平台高速下载了!
进入国家微生物科学数据中心官网http://www.nmdc.cn/ ,点击“数据下载”模块,进入数据下载界面。
进入数据下载界面以后,可以看到左侧导航栏既有国际数据可供下载,也有工具资源可以下载。国际数据目前包括核酸及蛋白质序列数据库、 基因组数据库、 蛋白质结构及功能数据库、文献数据库、物种及元数据库、宏基因组数据库、Blast数据库。
例如点击核酸及蛋白质序列数据库,就可以看到其所属类别下的Genbank-核酸数据库、DDBJ-核酸数据库、EMBL-核酸数据库、NCBI Gene数据库、NCBI Refseq数据库等11个子数据库。如Genbank-核酸数据库,其下方有该数据库的详细描述介绍、中英文关键词、最近更新日期、文件大小及下载链接等信息,用来帮助用户更好的识别该数据库的重点用途和了解数据的体量大小。点击下载链可以一键直达ftp下载地址进行整体数据下载,方便快捷,简单实用。
工具资源下载目前包括三大类别:微生物组软件包、扩增子数据库和宏基因组数据库。其中每个类别下都包含层次丰富和功能多样的工具包。例如其中微生物组软件包就包含易扩增子(EasyAmplicon)分析流程和R语言安装包。R语言安装包还包含Windows 10版4.0.x和Mac OS版4.0.x,供给用户多种选择。点击下载链接直达下载页面进行工具包下载,方便快捷,安全实用。
国家微生物数据中心数据下载功能欢迎广大科研用户使用,后续国际数据及工具资源还会持续增加,敬请期待~
如果您有什么需要下载的资源,也可以直接留言或发邮件告诉我们哦!
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读