cutadapt:
含流程,含各种:https://www.cnblogs.com/xudongliang/p/6404958.html
HISAT2和STAR:
当注释文件非常详细时,建议使用STAR或HIset2
HISAT2能够处理SNP信息,可以同时比对DNA和RNA
关于HISAT2的使用
(1)HISAT2 index的构建
可以输入的信息包括:
①SNP信息
dbSNP common文件
②可变剪切信息
GTF/GFF文件
③参考基因组序列
Genome FASTA文件
三种信息的下载方法:
SNP信息:
UCSC:download genome data → annotation → 搜common
用hisat2 build index:
#生成外显子信息
hisat2_extract_exons.py hg38_refseq.gtf > hg38_refseq.exon
#生成可变剪切位点信息
hisat2_extract_splice_sites.py hg38_refseq.gtf > hg38_refseq.ss
#生成snp和单倍体信息
hisat2_extract_snps_haplotypes_UCSC.py ref_hg38.fa snp151Common.txt snp151Common
#build index
hisat2-build -p 6 --snp snp151Common.snp --haplotype snp151Common.haplotype --exon hg38_refseq.exon --ss hg38_refseq.ss ref_hg38.fa ref_hg38.fa.snp_gtf > hisat2_build.log 2>&1
#ref_hg38.fa.snp_gtf 是index的名字
这些东东要用hisat的函数重新处理一下