我的第一次RNAseq分析

本文记录了作者首次进行RNAseq分析的过程,从接收fastq文件开始,通过预处理去除不合格reads,然后使用特定基因组文件进行比对。涉及的工具有生物学数据处理和服务器资源。
摘要由CSDN通过智能技术生成

从师姐那儿拿到了整个大概的protocol

0. 预处理。  将公司给的fastq格式的文件变成clean.fastq。去掉一些不合格的reads

1.比对。 运用以下命令生成一个参考基因组。我有师姐之前留下的基因组文件,名叫GCF_000002035.5_GRCz10_genomic.fna,我也不知道这是个什么格式。从ensemble上下载的目标基因组是.fa格式的。

cd /public/home/iemb315/Danio_genome
/public/opt/sc/program/STAR-STAR_2.4.1c/source/STAR \
--runThreadN 12 --runMode genomeGenerate --genomeDir ./ \--genomeFastaFiles ./GCF_000002035.5_GRCz10_genomic.fna
得到:

[iemb315@node100 ~/Danio_genome]$ls -shl
total 15G
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 Aligned.out.sam
8.0K -rw-rw-r-- 1 iemb315 iemb315 6.2K Mar  8 09:56 chrLength.txt
 24K -rw-rw-r-- 1 iemb315 iemb315  22K Mar  8 09:56 chrNameLength.txt
 16K -rw-rw-r-- 1 iemb315 iemb315  16K Mar  8 09:56 chrName.txt
 12K -rw-rw-r-- 1 iemb315 iemb315  12K Mar  8 09:56 chrStart.txt
1.3G -rw-rw-r-- 1 iemb315 iemb315 1.3G Mar  6 21:51 GCF_000002035.5_GRCz10_genomic.fna
1.6G -rw-rw-r-- 1 iemb315 iemb315 1.6G Mar  8 10:30 Genome
4.0K -rw-rw-r-- 1 iemb315 iemb315  538 Mar  8 09:55 genomeParameters.txt
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 indexForCFpe100.log
104K -rw-rw-r-- 1 iemb315 iemb315 104K Mar  8 10:30 Log.out
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 Log.progress.out
4.0K -rw------- 1 iemb315 iemb315  234 Mar  6 22:23 nohup.out
 11G -rw-rw-r-- 1 iemb315 iemb315  11G Mar  8 10:30 SA
1.5G -rw-rw-r-- 1 iemb315 iemb31
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值