Minimap2是知名比对工具BWA的开发者Li Heng新开发的比对工具,它能够快速的将DNA或者mRNA序列比对到参考基因组上,使用场景有下面几种:
- 将PacBio或OXford Nanopore的read和已有参考基因组(如人类)进行比对
- 寻找高错误率read(15%)之间的overlap
- 将PacBio Iso-Seq 或Nanopore cDNA或RNA序列比对到参考基因组
- 将illumina 单端或者双端序列比对到参考基因组
- 组装之间的比对
- 临近物种的全基因组比对
最近用Canu的不同参数装了几个版本的基因组,希望比较不同组装之间是否连续,要是在组装结果A里面的是ABCD的排布,在结果B里面却出现了倒置变成了ACBD,那么我就要怀疑人生了。
我仔细看了一下PAF的输出格式,发现输出结果非常友好,但是不可能直接用 read.table
或者 data.table::fread
读取,所以我就自己写了一个解析函数。同时为了提高我对R语言中grid系统的理解,我又写了一个专门的画图代码