1.安装Ubantu LTS
2.安装miniconda3
3.配置清华镜像源
4.用fastp对数据进行处理
(加参数 l 20 过滤掉reads长度小于20的数据,否则Hisat2会报错,提示reads长度应该大于20)
/home/wm_771/miniconda2/bin/fastp -f 10 -F 10 --detect_adapter_for_pe -x -h SRR10251179.sra.html -c -q 15 -u 40 -g -n 5 -l 20 -i SRR10251179.sra_1.fastq.gz -I SRR10251179.sra_2.fastq.gz -o SRR10251179.clean.sra_1.fastq.gz -O SRR10251179.clean.sra_2.fastq.gz
5.使用hisat2比对到参考基因组
- 建立索引
#gff文件转换为gtf格式,gffread是cufflinks的小脚本
#gff2gtf
gffread watermelon_97103_v2.gene_model.gff -T -o watermelon_97103_v2.gtf
#gtf2gff
gffread merged.gtf -o- > merged.gff3
extract_splice_sites.py Lsiceraria_v1.gtf >>Lsiceraria_v1.ss
extract_exons.py Lsiceraria_v1.gtf >>Lsiceraria_v1.exon
hisat2-build -p 4 Lsiceraria_v1.fa --ss Lsiceraria_v1.ss --exon Lsiceraria_v1.exon genome_snp_tran_index
- 比对
下面展示一些内联代码片
。