HISAT2双端read比对结果解释

1,比对后的输出为:

在这里插入图片描述

416514 reads指的是有416514 pairs pf reads
它的比对策略是先比对两端都和谐比对上(aligned concordantly,指read1和read2的方向和距离都合适)的。
然后发现274284 (65.85%) aligned concordantly 0 times,进一步对这部分进行解析,发现这其中有3358 (1.22%) 能不和谐比对上(aligned discordantly)
最后再对pair比对不上的拆分成read 1,read 2比对(270926 pairs由541852 mates组成),再统计单条reads比对上的情况。
overall比对率的计算方法:

(51100+57804+3358X2+27792X2+114438X2)/(416514X2)=0.4803

HISAT2 是一款广泛使用的 RNA-seq 数据比对软件,可以将 RNA-seq 数据比对到参考基因组上。为了生成正确的 HISAT2 比对代码,您需要考虑以下几个方面: 1. 参考基因组文件:首先需要准备好参考基因组文件,可以是 FASTA 格式的基因组序列文件,也可以是 HISAT2 索引文件。如果没有可用的参考基因组文件,可以从 NCBI 等公共数据库下载。 2. RNA-seq 数据:需要准备好 RNA-seq 数据文件,可以是单端或双端测序数据,可以是 FASTQ 格式的数据文件,也可以是 SAM 或 BAM 格式的对齐结果文件。 3. HISAT2 命令行参数:在运行 HISAT2 时,需要指定一些命令行参数,以控制比对过程中的各个步骤。例如,可以使用 "-x" 参数来指定参考基因组索引文件,使用 "-U" 参数来指定单端或双端测序数据文件,使用 "-S" 参数来指定输出的 SAM 文件名,还可以使用其他参数来控制比对的参数和输出格式等。 4. 常用参数设置:在实际使用过程中,需要根据具体的数据和分析任务,设置一些常用的参数。例如,可以设置 "-q" 参数来指定 FASTQ 格式的输入数据,使用 "-p" 参数来指定线程数,使用 "--no-spliced-alignment" 参数来禁用剪接比对等。 下面是一个简单的 HISAT2 比对示例: ``` hisat2 -x ref_genome -U reads.fastq -S output.sam -p 4 ``` 该命令将使用参考基因组索引文件 "ref_genome",对单端测序数据文件 "reads.fastq" 进行比对,输出结果到 SAM 文件 "output.sam" 中,并使用 4 个线程来加速比对过程。 希望这些信息能够帮助您生成正确的 HISAT2 比对代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值