基因组组装质量评估之merqury——KAT升级版

merqury是评估基因组质量的一个新工具,基于Kmer对基因组进行评估,获得一致性质量(QV),组装完整度(通过Kmer_multiplicity & Count 图和comleteness值获得)。可以无参考基因组或数据库的方式评估基因组组装质量。

#老规矩,建议使用conda独立环境
conda create -n merqury
#激活环境
conda activate merqury
#安装merqury
mamba install -c bioconda merqury
#安装meryl
wget https://github.com/marbl/meryl/releases/download/v1.3/meryl-1.3.Linux-amd64.tar.xz
tar -xJf meryl-1.3.Linux-amd64.tar.xz
cd meryl-1.3/bin
export PATH=$pwd:$PATH
#确定最佳的kmer大小,获得k=19
best_k.sh 124634712
##best_k.sh <genome_size>
​
​
cat read_?_1.clean1.fq > merged.clean1.fq
cat read_?_2.clean2.fq > merged.clean2.fq
#为每个reads建立dbs
for i in {1..2}; do
  meryl k=19 count output read$i.meryl merged.clean$i.fq
done
#合并meryl
meryl union-sum output read.meryl read*.meryl
#运行merqury
merqury.sh read.meryl genome_file.fa profix

结果中重点关注这些文件信息:

  • .spectra-asm..png #组装基因组与reads的比对图,可视化基因组与reads的一致性,从图中可以看出组装是否完整
  • *.qv #基因组的QV值,即一致性质量值
  • *.ompleteness.stats #kmer完整度
    此外,该工具还可以评估二倍体基因组分型质量,判断分型后的单倍型基因组是否存在混杂等。

参考文献:
【1】基因组组装评估 — Merqury | JWei’s Blog (http://zerobio.github.io)
【2】Rhie, A., Walenz, B. P., Koren, S. & Phillippy, A. M. Merqury: reference-free quality, completeness, and phasing assessment for genome assemblies. Genome Biol 21, 245 (2020).

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值