本博客的主要目的是把本次使用Leafcutter做可变剪切的分析流程记录一下,以方便后续分析或者分享给别人。 Leafcutter的文章发表在了NG上,有感兴趣的可以看原文。
#批量改文件的名字
#A0-cbp20-1_L4_380380.R1.fastq.gz
#A0-cbp20-1.R1.fastq.gz
ls *.gz | while read id; do sample_name=${id%%_*}; file_name=${id#*.}; mv $id $sample_name.$file_name;done
# fastp to remove adapters and low quality reads
cd /home/zhanghuairen/zzp_alternative2/clean_data
ls ../raw_data/fastq/*.gz | while read id; do file_name=`basename $id`; out_name=${file_name%%.*}; \
fastp -i "../raw_data/fastq/$out_name.R1.fastq.gz" -I "../raw_data/fastq/$out_name.R2.fastq.gz" \
-o $out_name.clean.R1.fq.gz -O $out_name.clean.R2.fq.gz -w 16 -h "$out_name.html" -j "$out_name.json";done
#build genome index with STAR
star=~/software/STAR/source/STAR
time $star --runThreadN 20 --runMode genomeGenerate \
--genomeDir ~/zzp_alternative2/ref/ --genomeFastaFiles Athaliana_447_TAIR10.fa \
--sjdbGTFfile Athaliana_447.gtf --sjd