Hisat2的使用说明

最新推荐文章于 2025-02-14 19:57:49 发布

小小杰瑞_

最新推荐文章于 2025-02-14 19:57:49 发布

阅读量1.5k

点赞数 11

文章标签：服务器 java linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58052042/article/details/140689631

版权

Hisat2是一款用于将测序读段（reads）比对（align）到参考基因组上的软件。以下是Hisat2的基本用法及其参数含义的中文说明：

基本用法

要使用Hisat2进行比对，你需要提供一个索引文件（由.fasta参考基因组文件构建而成）和测序读段文件。以下是Hisat2比对的基本命令格式：

hisat2 [选项] -x <索引前缀> {-1 <读段1> -2 <读段2> | -U <单端读段>} [-S <SAM输出文件>]

<索引前缀>：索引文件的名称前缀（不包括后面的.X.ht2）。
<读段1> 和 <读段2>：成对的读段文件，可以是压缩的（.gz或.bz2）。
<单端读段>：单端读段文件，可以是压缩的。
<SAM输出文件>：输出的SAM格式的比对结果文件。

常用参数及其含义

-x <索引前缀>：指定索引文件的名称前缀。
-1 <读段1> 和 -2 <读段2>：指定成对读段的文件路径。
-U <单端读段>：指定单端读段的文件路径。
-S <SAM输出文件>：指定输出SAM文件的路径。
-p <线程数>：指定使用的线程数，以提高比对速度。
--phred33 和 --phred64：指定测序质量值的编码方式（默认为Phred+33）。
--fast、--sensitive、--very-sensitive：预设参数，用于调整比对敏感性和速度。
--bowtie2-dp <int>：使用Bowtie2的动态规划比对算法（0表示不使用，1表示有条件使用，2表示无条件使用）。
--n-ceil <func>：设置比对中允许的非ACGT字符的最大数量。
--ignore-quals：忽略质量值，将所有质量值视为30。
--no-softclip：不进行软剪辑。
--rdg <int>,<int> 和 --rfg <int>,<int>：设置读段和参考基因组比对时的缺口开放和延伸惩罚。
-k <int>：最多搜索指定数量的不同比对位置。
--max-seeds <int>：设置最多扩展的种子数量。
--un <path> 和 --al <path>：分别指定未比对和至少比对一次的读段的输出路径。
--un-conc <path> 和 --al-conc <path>：分别指定不成对和至少成对比对的读段的输出路径。
--time：打印比对各阶段所花费的时间。
--reorder：使SAM输出顺序与输入读段顺序一致。

RNA-seq特定参数

--rna-strandness <string>：指定RNA-seq数据的链特异性信息。
--no-spliced-alignment：禁用剪接比对。
--min-intronlen <int> 和 --max-intronlen <int>：设置允许的最小和最大内含子长度。

博客等级

码龄4年

5
原创

48
点赞

37
收藏

30
粉丝

关注

私信

热门文章

最新评论

gatk的参数和用法
小小杰瑞_: 不同版本的gatk提取SNP和indel的命令不同。各版本GATK的说明书，你可以根据自己的GATK的版本查看命令： https://gatk.broadinstitute.org/hc/en-us/categories/360002369672-Tool-Index
gatk的参数和用法
weixin_65013952: 在使用 --known-sites 参数时，为啥会出现：A USER ERROR has occurred: — is not a recognized option 的报错求解

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。