linux 基因组数据下载,批量下载JGI（phytozome植物基因组数据库）数据

最新推荐文章于 2024-09-02 13:29:44 发布

weixin_39608134

最新推荐文章于 2024-09-02 13:29:44 发布

阅读量2.4k

点赞数 1

文章标签： linux 基因组数据下载

本文介绍了如何使用Linux命令行工具批量下载JGI（_phytozome_ 植物基因组数据库）的基因组数据。通过注册JGI账号、保存cookies、获取数据列表、整理链接并使用`parallel`命令进行并行下载，实现了高效的数据获取。文章还提到了可能需要根据植物双名法进一步处理数据的情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

52487a4ff5fc

写在前面

今天课题组师妹与我提到，其要下载Phytozome上的所有数据。这个事情，我在早在几年前干过。不过前年有整了一次。整体简单，以下附上之前的记录。

2017年的记录

稍微整理了流程，方便批量下载JGI基因组数据。因为一个一个点，一个一个下载，太浪费时间且不稳定。调试了下，直接开80个下载任务，批量下载JGI目前已有的所有植物基因组序列(20170405)，共72个。

首先，在JGI上注册一个账号，

http://genome.jgi.doe.gov/

得到账号密码，如

账号：yourAccount

密码：youPassword

在linux上，使用curl登录并保存cookies(不知道cookies的，可以理解为登陆信息)

# 2017年的链接方式已经失效

# curl https://signon.jgi.doe.gov/signon/create --data-ascii login=yourAccount\&password=youPassword -b cookies -c cookies > /dev/null

# 目前有效的链接方式是

curl 'https://signon-old.jgi.doe.gov/signon/create' --data-urlencode 'login=yourAccount' --data-urlencode 'password

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39608134

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

ncbi-genome-download批量下载基因组数据

hgz2020的博客

10-11

8627

ncbi-genome-download

SRA数据下载方法总结

weixin_44065382的博客

09-21

8842

SRA数据常用的下载方法研究生了，对以往的知识进行一个复习和总结吧。 SRA数据库存储了现在主要高通量测序平台的原始测序数据和和比对信息，包括了SRA、EBI、DDBJ、JGI等数据库的信息。（这里分享一个小的知识点，现在可以不只依赖NCBI进行查找和下载，国家基因组科学数据中心（NGDC）官网已经进行了整合）。对于NGDC数据库的使用在这里就暂时不细说了，看后面有没有必要吧，使用方法更加贴合中国人的习惯的。言归正传，现在SRA数据的下载主要有以下5个方法： 1、NCBI官方提供的SRA Toolki

参与评论您还未登录，请先登录后发表或查看评论

linux 基因组数据下载,phytozome植物基因组下载网站

weixin_32515349的博客

05-13

2255

Phytozome 作为专门收录植物基因组的网站，在基因组数据的下载、查询、可视化浏览等方面做的也很不错，也是一个不错的基因组数据下载数据库。今天主要介绍一下该网站基因组如何下载，如何通过blast查询同源基因，以及根据基因相关功能结构域批量下载相关基因的CDS，PEP等序列信息；基因组下载该网站需要注册登陆之后才能下载基因组数据：注册也非常简单，这里就不详细说明了：注册完账号登陆就可以：http...

linux下下载基因组程序,【生信】利用shell批量下载NCBI基因组

weixin_39936792的博客

05-03

2427

1、搜索基因组在这个网址(https://www.ncbi.nlm.nih.gov/genome/browse/#!/overview/)里搜索，如：Streptomyces。点击Prokaryotes使得呈现的结果最右一列是FTP。根据Filters可以筛选想要的结果，最后点击Download下载表格，表格中将含有批量下载所需要的FTP。下载含FTP的表格2、处理FTP打开刚刚下载的表格，复制F...

基因组数据库

07-03

基因组数据库，1.3G，包括图像，数据太大，放在百度网盘，资源内附链接和密码

从 NCBI 批量下载基因组文件

最新发布

Xylonwin的博客

09-02

3670

一个简单的思路通过 Bash 脚本从 NCBI 的 FTP 服务器批量下载基因组文件，无需任何依赖

HipMer:用于大基因组数据的高性能分布式内存组装器-开源

06-02

单基因组组装实现是 Meraculous 组装器 (http://jgi.doe.gov/data-and-tools/meraculous/) 的高性能并行化和端口。 MetaHipMer 扩展是 HipMer 的最新成员，适用于大型宏基因组，并利用迭代 kmer 大小和专门的脚手架...

基因组去冗余主流软件安装

qq_47054630的博客

04-12

2705

CD-HIT。

如何下载生物数据（一）：生物数据检索

xxxie_的博客

08-20

1450

Phytozome通过端口批量下载文件

little^raccoon

02-22

1587

Phytozome官网提供了四种数据下载方式，前三种为网页操作模式，在此不多介绍，在此主要介绍第四种官方manual Download with Cart Download with web UI Download with Globus service Download with API Download with API 1. 登陆账号 curl 'https://signon.jgi.doe.gov/signon/create' --data-urlencode 'login=USER_NA.

Linux 下载 JGI 的 IMG_VR

m0_53945548的博客

03-13

1286

点击左上角DOWNLOAD，登录自己的账号，点击使用XML。进入之后，主要看url，你的下载地址。

JGI Phytozome 批量下载的几种方法

Xingze_Li

08-06

7522

方法一登陆账号 curl 'https://signon.jgi.doe.gov/signon/create' --data-urlencode 'login=*****' --data-urlencode 'password=*****' -c cookies > /dev/null # ****处修改为账号与密码下载所有文件的列表 curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get-directory?organism

linux下载NCBI基因组数据

k7586556的博客

10-12

1785

fastq-dump --gzip --split-3 SRR25474921.sra，#使用fastq-dump将sra转换为fastq格式，--split-3 参数可以把双端测序的reads提取出来，左端标示为*_1.fastq；右端标示为*_2.fastq。安装之后转到NCBI网页搜索需要的数据或者到SRA数据中查找，我下载的是SRA数据库中的SRR25474921（SRA中是原始测序数据）prefetch --option-file SRR_Acc_List.txt #下载多个SRA文件。

从NCBI批量下载序列

立身以力学为先，力学以读书为本。 —郑耕老《劝学》

04-10

4931

Three easy ways to download multiple sequences from NCBI There are different ways of how to download multiple sequences from the NCBI databases in a single request. 1) Using the batch Ent

selenium-蛋白质组学数据爬取

songyi10的博客

12-13

507

背景：Box driver中的数据无法自动下载，使用对应的下载链接也需要登录后才能在浏览器中使用，于是使用selenium对其进行自动下载。

查询和保存基因序列

weixin_42417422的博客

06-17

1406

使用基因数据库进行查询：使用公共基因数据库，如NCBI（National Center for Biotechnology Information）的GenBank、Ensembl、UCSC Genome Browser等，输入目标基因的名称或ID进行查询。下载基因序列：选择你要保存的基因序列记录，然后使用数据库提供的下载选项将基因序列保存到本地计算机。请注意，在使用公共基因数据库查询和下载基因序列时，遵守数据库的使用规则和版权政策。确定目标基因：首先，确定你感兴趣的基因名称、基因ID或基因的相关信息。

ncbi-genome-download在NCBI上批量下载基因组

xq_ing的博客

10-12

4009

ncbi-genome-download在NCBI上批量下载基因组

可以下载genome数据的几个网站

薛猫_柳叶刀

03-26

3493

Ensembl-plant ftp://ftp.ensemblgenomes.org/pub/ Ensembl-animal ftp://ftp.ensembl.org/pub/ NCBI: ftp://ftp.ncbi.nih.gov/genomes UCSC: http://hgdownload.soe.ucsc.edu/downloads.html 植

植物基因组数据库

qq_36608036的博客

10-30

5247