1. mapquik简介
mapquik是基于 k−min-mers的超快速读取映射器,它将三代测序PacBio HiFi长且准确的reads比对到参考基因组,在真实数据和模拟数据上,mapquik相比对minimap2速度快37倍。
github地址: https://github.com/ekimb/mapquik
2. 软件安装
# linux
git clone https://github.com/ekimb/mapquik.git
cd mapquik
# 安装rust,installion options按enter键默认即可
curl -sSf https://sh.rustup.rs | sh
echo "export PATH=$HOME/.cargo/env:$PATH" >> ~/.bashrc
source ~/.bashrc
# 安装mapquik
rustup install nightly
cargo +nightly build --release
3. 基本用法
mapquik采用单个gzip压缩或未压缩的FASTA/FASTQ输入作为输入, 输出是一个常规的PAF文件。
mapquik <reads.fq> --reference <reference.fa>
4. 比对示例
# 运行example模拟数据
cd example && bash run_ecoli.sh
bash simulate_pbsim.sh && bash run_ecoli_full.sh
# 下载示例fastq
wget https://storage.googleapis.com/brain-genomics-public/research/deepconsensus/data/v0.3/assembly_analysis/fastqs/HG002_24kb_2SMRT_cells.dc.v0.3.q20.fastq.gz
# 解压
gunzip -c HG002_24kb_2SMRT_cells.dc.v0.3.q20.fastq.gz | grep -v TOTAL > dc.hg002.fastq
# 比对
mapquik dc.hg002.fastq --reference reference.fa -p mapquik-dc
生信软件文章推荐
生信软件1 - 测序下机文件比对结果可视化工具 visNano
生信软件3 - mapping比对bam文件质量评估工具 qualimap
生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
生信软件7 - 多线程并行运行Linux效率工具Parallel
生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计
生信软件9 - 多公共数据库数据下载软件Kingfisher
生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa
生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV
生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )
生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计
生信软件14 - bcftools提取和注释VCF文件关键信息
生信软件15 - 生信NGS数据分析强大的工具集ngs-bits
生信软件17 - 基于fasta文件的捕获探针设计工具catch
生信软件18 - 基于docker部署Web版 Visual Studio Code
生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑
生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump
生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle
生信软件23 - Samtools和GATK去除PCR重复方法汇总
生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download
生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2
生信软件27 - 基于python的基因注释数据查询/检索库mygene
生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair