基因组从头组装

本文介绍了基因组组装的三个层次:contig、scaffold和chromosomes,并重点讲解了使用SPAdes进行组装和QUASTA进行评估的步骤。通过SPAdes的-k参数选择合适的K值,以及QUASTA解决安装问题的过程,为基因组组装提供了一条实践路径。
摘要由CSDN通过智能技术生成

基因组组装

基因组组装一般分为三个层次,contig, scaffold和chromosomes. contig表示从大规模测序得到的短读(reads)中找到的一致性序列。组装的第一步就是从短片段(pair-end)文库中组装出contig。进一步基于不同长度的大片段(mate-pair)文库,将原本孤立的contig按序前后连接,其中会调整contig方向以及contig可能会存在开口(gap,用N表示),这一步会得到scaffolds,就相当于supercontigs和meatacontigs。最后基于遗传图谱或光学图谱将scaffold合并调整,形成染色体级别的组装(chromosome).【转载】

具体详细可以仔细阅读https://www.jianshu.com/p/f1ba7c96160f

里面写了很多软件以及练习数据,软件的安装,进行多次试探以及看了多篇文章,最终发现用SPAdes 组装 ,QUAST评估用的比较好。

SPAdes 安装比较简单(http://spades.bioinf.spbau.ru/release3.10.1/manual.html

 wget http://cab.spbu.ru/files/release3.10.1/SPAdes-3.10.1.tar.gz
tar -xzf SPAdes-3.10.1.tar.gz
cd SPAdes-3.10.1/bin/

运行脚本(我的数据是单端测序,选择 -s,根据数据,有多种参数选择 )

sudo python spa

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值