从师姐那儿拿到了整个大概的protocol
0. 预处理。 将公司给的fastq格式的文件变成clean.fastq。去掉一些不合格的reads
1.比对。 运用以下命令生成一个参考基因组。我有师姐之前留下的基因组文件,名叫GCF_000002035.5_GRCz10_genomic.fna,我也不知道这是个什么格式。从ensemble上下载的目标基因组是.fa格式的。
得到:cd /public/home/iemb315/Danio_genome
--runThreadN 12 --runMode genomeGenerate --genomeDir ./ \--genomeFastaFiles ./GCF_000002035.5_GRCz10_genomic.fna/public/opt/sc/program/STAR-STAR_2.4.1c/source/STAR \
[iemb315@node100 ~/Danio_genome]$ls -shl total 15G 0 -rw-rw-r-- 1 iemb315 iemb315 0 Mar 6 22:23 Aligned.out.sam 8.0K -rw-rw-r-- 1 iemb315 iemb315 6.2K Mar 8 09:56 chrLength.txt 24K -rw-rw-r-- 1 iemb315 iemb315 22K Mar 8 09:56 chrNameLength.txt 16K -rw-rw-r-- 1 iemb315 iemb315 16K Mar 8 09:56 chrName.txt 12K -rw-rw-r-- 1 iemb315 iemb315 12K Mar 8 09:56 chrStart.txt 1.3G -rw-rw-r-- 1 iemb315 iemb315 1.3G Mar 6 21:51 GCF_000002035.5_GRCz10_genomic.fna 1.6G -rw-rw-r-- 1 iemb315 iemb315 1.6G Mar 8 10:30 Genome 4.0K -rw-rw-r-- 1 iemb315 iemb315 538 Mar 8 09:55 genomeParameters.txt 0 -rw-rw-r-- 1 iemb315 iemb315 0 Mar 6 22:23 indexForCFpe100.log 104K -rw-rw-r-- 1 iemb315 iemb315 104K Mar 8 10:30 Log.out 0 -rw-rw-r-- 1 iemb315 iemb315 0 Mar 6 22:23 Log.progress.out 4.0K -rw------- 1 iemb315 iemb315 234 Mar 6 22:23 nohup.out 11G -rw-rw-r-- 1 iemb315 iemb315 11G Mar 8 10:30 SA 1.5G -rw-rw-r-- 1 iemb315 iemb31