摘要
很久没有整理工作笔记了,一方面个人有些倦怠,另一方面国内国际发生的事都牵动着许多人,我也不例外。趁着今天项目不多,记录一下最近的解决方案。
上周遇到一个想检测测序样品中是否包含预期的细菌物种。使用nr数据库比对以及metaphlan3进行物种注释都找到了客户的预期物种。然后客户希望通过测序数据组装出一套基因组。要求是组装出来的contig必须是都比对上参考基因组的。这个虽然不难,而且方法还不少,比如可以用之前去宿主的思路保留比对序列。但是这次我用了另外的工具,之前没具体做过,因此进行一个记录。
工具与方法
主要使用blast
和seqtk
这两个工具,前者进行序列比对,后者进行序列提取。
操作方法
step.1 构建参考基因组数据库
makeblastdb
是blast用来构建数据库的命令,-in
为输入参考基因组序列,-dbtype
为数据库类型,一般就核酸序列和蛋白序列两种。
makeblastdb -in ref_bilvae.fasta -dbtype nucl
<