这个问题困惑了我好久。后来在一个偶然的机会下解决了,分享给大家,如果你在使用htseq-count的时候遇到同样的问题。
首先,直接分享这个问题的解决方案。
出现该错误的主要原因是:
(1)这个GTF/GFF3 文件不是常规渠道下载下来的。比如我,是自己仿照UCSC官网上的注释文件的格式,自己“合成”的。
(2)gff文件是1-based,所谓1-based指的是,从1开始的坐标,所以最小值应该是1。而我合成的gtf文档之所以出错的原因是坐标是0-based,最小值是0。
之所以会发现问题的原因在这里,是因为偶然间想要用igv去尝试打开我合成的gtf文档,结果igv在排序的时候报出错误。
故而,此处吐槽一下,觉得htseq-count的错误提示太不近人情了!(虽然,这是一个比较厉害的软件)
解决问题的思路也比较简单,复杂一点,把所有的坐标轴全部加一,或者比较简单一点的,把所有的0调整为1即可。