Step1:软件安装
数据资源下载,参考基因组及参考转录组(linux)
gtf ,genome,fa
质控,需要fastqc及multiqc(linux)
trimmomatic,cutadapt,trim-galore
对比(linux)
star,HISAT2,TOPHAT2, bowtie,bwa,subread
计数(linux)
featureCounts,htseq-counts,bedtools
nomalization 归一化,差异分析等(R 包)
DEseq2,edgeR,limma
注,fastqc和trim-galore需要下载openjdk,非常大,建议使用conda install --offline /home/xxx/src/openjdk-11.0.1-h516909a_1016.tar.bz2 线下安装
conda install -y fastqc trim-galore star bwa hisat2 bowtie2 subread tophat htseq bedtools deeptools salmon cutadapt multiqc sra-tools
conda install -c bioconda trimmomatic
Step2:原始数据校验
md5sum -c cdmd5.txt
Step3: 数据质控与矫正
3.1. fastqc
fastqc 批处理并将结果保存在qc文件夹下
fastqc -o ./qc/ *.fq.gz
multiqc整合fastqc结果
multiqc -o .