Hi-C技术辅助组装软件Lachesis安装

LACHESIS这个软件名字起得很好,Lachesis是希腊神话众神之一,负责决定生命之线的长度,但是安装起来,却非常折腾生命,很是麻烦。该软件是由shendurelab开发的用于辅助基因组组装的工具,13年发表在nat bio(https://doi.org/10.1038/nbt.2727)上面,也是非常牛了。

github地址:https://github.com/shendurelab/LACHESIS

我们看一下它的依赖,真多,还对版本有要求,用conda安吧,发现还没有,简直了。。。

其中LACHESIS需要两个依赖对版本的要求,一个低版本的samtools(低于0.1.19)和C++的库boost库(1.52.0<版本<1.67.0),boost库要求是参考网友的帖子来的。

查一下服务器上boost库版本吧:

cat /usr/include/boost/version.hpp | grep “BOOST_LIB_VERSION”

// BOOST_LIB_VERSION must be defined to be the same as BOOST_VERSION

#define BOOST_LIB_VERSION “1_53”

谢天谢地,可以少安一个。

1.安装0.1.19版本的samtools和剩下的几个依赖:

https://sourceforge.net/projects/samtools/files/samtools/
tar -jxvf samtools-0.1.19.tar.bz2
autoheader
make
samtools安装好。
conda install -c bioconda blast
conda install -c bioconda bedtools

2.安装LACHESIS:

tar -zxvf shendurelab-LACHESIS-2e27abb.tar.gz
mv shendurelab-LACHESIS-2e27abb LACHESIS
添加两个环境变量:
export LACHESIS_BOOST_DIR=/usr/include/boost/
export LACHESIS_SAMTOOLS_DIR=/public/home/lvqiang/software/samtools-0.1.19
./configure报错错误1,根据提醒修改:
./configure --with-samtools=/public/home/lvqiang/software/samtools-0.1.19
make

然后报错:

由于之前安装的samtools并不是安装在/usr目录下,因此要修改:src/include/gtools/目录下的SAMStepper.h和SAMStepper.cc中的

#include, 指向实际地址。

例如我的是

#include </public/home/lvqiang/software/samtools-0.1.19 /sam.h>

再重新make,成功安装。

3.错误总结:

1. error: either specify a valid samtools installation with --with-samtools=DIR

一开始我用conda install -c yuxiang samtools 安装的0.1.19的samtools,在miniconda3/bin/目录也能成功运行,可提示samtools安装不正确,我们注意一下上面几个no提醒,conda安装的bin/目录下没有sam.h这样的文件,而非conda安装的有。手动安装0.1.19版本的samtools后再export后,这个错误就没有了。

4.后记:

这款软件没有conda版本,事实上,其开发团队早就不维护这个软件了,GitHub主页上也推荐使用https://github.com/theaidenlab里的工具进行组装。我安装它完全是因为看着公司之前的结题报告有用到它,也就安装了,即使在安装过程中随着了解知道了这个软件使用上的有很多问题,安装困难、无法处理多倍体、已经许久不维护、运行时还会出问题。可能我后期都不会用这个软件。

至此,软件安装的工作告一段落(安装了50多个软件),开始在我的数据到来之前,从公众数据库下一些数据做一些和自己课题相关的分析吧。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 是的,hifiasm 组装出的结果可以合并后再挂载到染色体上。一般来说,将 hifiasm 组装出的 contigs(连通图)进行比对,可以得到 contigs 与染色体的相对位置和方向。然后,可以使用一些工具,如 LINKS 或 LACHESIS,将这些 contigs 进行排列和定向,形成一个连续的染色体。最后,可以使用一些工具,如 SSPACE 或 OPERA,将这些 contigs 进行拼接,生成一个完整的染色体序列。 ### 回答2: hifiasm 是一种高精度的基因组组装算法,它可以将长读长(long reads)数据用于组装染色体。通常情况下,hifiasm 组装出的结果可以合并后再挂载到染色体。 在 hifiasm 组装通常有两个步骤,第一步是将长读长数据拼接成超长的序列,称为超级拼接(supercontig)。这些超级拼接可能由于测序错误或者毛发变异等原因存在一定程度的错误。第二步是将超级拼接与参考基因组进行比对,通过比对的结果对超级拼接进行校正,提高组装的准确性。 在组装完毕后,可以使用合并工具将多个超级拼接合并成更大的拼接,形成染色体水平的组装结果。这样的合并步骤可以进一步提高组装的连贯性和准确性。 经过合并的结果可以被挂载到染色体,即将得到的拼接序列与染色体上的其他基因组装结果相结合。这可以通过染色体构建技术来实现,例如使用基于接触频率的染色体构建方法。挂载到染色体的结果可以帮助我们更好地理解基因组结构和功能,进一步研究染色体上的基因调控等生物学过程。 总之,hifiasm 组装出的结果是可以合并后再挂载到染色体的,这有助于我们进一步研究和了解基因组的结构和功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值