merqury是评估基因组质量的一个新工具,基于Kmer对基因组进行评估,获得一致性质量(QV),组装完整度(通过Kmer_multiplicity & Count 图和comleteness值获得)。可以无参考基因组或数据库的方式评估基因组组装质量。
#老规矩,建议使用conda独立环境
conda create -n merqury
#激活环境
conda activate merqury
#安装merqury
mamba install -c bioconda merqury
#安装meryl
wget https://github.com/marbl/meryl/releases/download/v1.3/meryl-1.3.Linux-amd64.tar.xz
tar -xJf meryl-1.3.Linux-amd64.tar.xz
cd meryl-1.3/bin
export PATH=$pwd:$PATH
#确定最佳的kmer大小,获得k=19
best_k.sh 124634712
##best_k.sh <genome_size>
cat read_?_1.clean1.fq > merged.clean1.fq
cat read_?_2.clean2.fq > merged.clean2.fq
#为每个reads建立dbs
for i in {1..2}; do
meryl k=19 count output read$i.meryl merged.clean$i.fq
done
#合并meryl
meryl union-sum output read.meryl read*.meryl
#运行merqury
merqury.sh read.meryl genome_file.fa profix
结果中重点关注这些文件信息:
- .spectra-asm..png #组装基因组与reads的比对图,可视化基因组与reads的一致性,从图中可以看出组装是否完整
- *.qv #基因组的QV值,即一致性质量值
- *.ompleteness.stats #kmer完整度
此外,该工具还可以评估二倍体基因组分型质量,判断分型后的单倍型基因组是否存在混杂等。
参考文献:
【1】基因组组装评估 — Merqury | JWei’s Blog (http://zerobio.github.io)
【2】Rhie, A., Walenz, B. P., Koren, S. & Phillippy, A. M. Merqury: reference-free quality, completeness, and phasing assessment for genome assemblies. Genome Biol 21, 245 (2020).