RNA-Seq分析笔记(1)--- 参考基因组准备和建立索引文件

这篇笔记详细记录了RNA-Seq分析中参考基因组的下载与准备,以及使用HISAT2建立索引的过程。首先从UCSC网站下载人类基因组(GRCh37/hg19)的染色体FASTA文件,通过Linux命令合并成hg19.fa。接着,使用HISAT2命令创建索引,耗时25小时。另外,也提到可以从HISAT2官网直接下载预构建的索引文件,以节省时间和资源。
摘要由CSDN通过智能技术生成

1. 参考基因组下载和准备

进入UCSC网站(http://genome.ucsc.edu/),Downloads >> Genome Data >> Human >> Feb. 2009 (GRCh37/hg19) >> Genome sequence files and select annotations (2bit, GTF, GC-content, etc) >> chromFa.tar.gz,右键复制链接地址如下:
http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz
在这里插入图片描述
可以在windows里用下载工具快速下载,传送到服务器上,使用下面命令解压缩。

tar xvzf chromFa.tar.gz

解压出来的新文件都是同一类型:chr*.fa。

chr1.fa chr5.fa chrUn_gl000223.fa
chr10.fa chr6.fa chrUn_gl000224.fa
chr11.fa chr6_apd_hap1.fa chrUn_gl000225.fa
chr11_gl000202_random.fa chr6_cox_hap2.fa chrUn_gl000226.fa
chr12.fa chr6_dbb_hap3.fa chrUn_gl000227.fa
chr13.fa chr6_mann_hap4.fa chrUn_gl000228.fa
chr14.fa chr6_mcf_hap5.fa chrUn_gl000229.fa
chr15.fa chr6_qbl_hap6.fa chrUn_gl000230.fa
chr16.fa chr6_ssto_hap7.fa chrUn_gl000231.fa
chr17.fa chr7.fa chrUn_gl000232.fa
chr17_ctg5_hap1.fa chr7_gl000195_random.fa chrUn_gl000233.fa
chr17_gl000203_ran
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值