GenomeScope——jellyfish k-mer分析的下游分析

GenomeScope 2.0是一个可对多倍体基因组数据进行概括性分析的有效工具,其可以将jellyfish或KMC等k-mer分析软件的结果作为输入,并拟合混合模型,对基因组数据进行更深入的挖掘。

一、安装

GenomeScope 2.0的工作依赖于R,且需要安装其依赖包argparseminpack.lm。可以使用conda工具进行安装:

#安装依赖包
conda install -c conda-forge r-base r-minpack.lm r-argparse

安装完依赖包后需要将Github的相关文件克隆到工作目录下:
(有些时候会因为链接时间太久,导致克隆失败,可以尝试直接下载源代码)

#克隆工作环境
git clone https://github.com/tbenavi1/genomescope2.0.git

现在,便可以进入genomescope2.0目录,使用R脚本install.R安装GenomeScope 2.0了。

#进入工作目录
cd genomescope2.0
#运行R脚本安装GenomeScope2.0
Rscript install.R

二、使用

在使用之前需要认识以下几个重要的参数:

参数功能
-i输入文件名
-o输出目录名
-kk-mers的k值
-p基因组的倍性,默认为2

现在,便可以使用其主要脚本文件genomescope.R.histo进行进一步分析了:

#进一步分析S_oblata_WGS_single.histo
genomescope2.0/genomescope.R -i S_oblata_WGS_single.histo -o GS_WGS -k 25

当出现:

GenomeScope analyzing S_oblata_WGS_single.histo p=2 k=25 outdir=GS_WGS
aa:92.7% ab:7.34%
Model converged het:0.0734 kcov:31.8 err:0.0632 model fit:1.94 len:537907208

即说明分析已经完成,其结果保存在GS_WGS目录下。
但是,由于文章中并没有提供具体的步骤,所以我得到的结果具有较高的错误率,可能是未进行数据过滤导致的。
在这里插入图片描述

Ending!!!

相关文章:

Ranallo-Benavidez, T.R., Jaron, K.S. & Schatz, M.C. GenomeScope 2.0 and Smudgeplot for reference-free profiling of polyploid genomes. Nature Communications 11, 1432 (2020). https://doi.org/10.1038/s41467-020-14998-3
Ma, B., Wu, J., Shi, TL. et al. Lilac (Syringa oblata) genome provides insights into its evolution and molecular mechanism of petal color change. Commun Biol 5, 686 (2022). https://doi.org/10.1038/s42003-022-03646-9

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Odd_guy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值