微生物文献解读:用问题形式串联文章主要思路及其结论,快速看懂正文主图。
MetaCHIP: community-level horizontal gene transfer identification through the combination of best-match and phylogenetic approaches
- 杂志:Microbiome [11.607]
- 发表时间:4 March 2019
- 第一单位:Centre for Marine Bio-Innovation, University of New South Wales
- 第一作者:Weizhi Song
- 通讯作者:Torsten Thomas
- 链接:https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-019-0649-y
简介
本文设计与开发算法MetaCHIP,结合序列比对和系统发育分析,可以实现无参考基因组的、在菌群层次上横向转移基因(HGT,horizontal gene transfer)的检测。
背景
- Q: 什么是横向转移基因(HGT)?
- A: 是指有机体之间遗传物质的转移,通常是微生物进化和适应性的重要原因(例如抗性基因,毒力基因)。
- Q: HGT和MGE(可移动遗传元件)的区别是什么?
- A: 虽然本文没有提及,但是我的理解是HGT可以是单个gene的转移。MGE是元件(element),指得是可以转移的(一般为)一簇(cluster)基因,他们一般包含行驶转移和整合功能的gene与所携带的gene(cargo gene),后者一般就是HGT关注的对象。
- Q: 为什么要研究bacterial community的HGT?
- A: 细菌本来就是以community发生作用,随着宏基因组学数据积累,可以让我们研究bacteria之间gene的转移,从而让我们从一个菌落的角度理解他们发挥的功能。
- Q: 以前都有什么方法?MetaCHIP的优势在哪里?
- A: 前人方法基本分为3种,以1.基因组成分特征(compositional features)为主的方法(如GIST,IslandViewer);2.最佳比对(best-match)为主的方法(如DrakHorse,HGTector);3. 显性系统发育分析为主的方法(如Ranger-DTL,AnGST),即对比gene tree和species tree之间的不一致性从而找到转移的gene。
以往方法一是不适用于community,二是需要reference genome,这都限制了它的运用。MetaCHIP就是能解决以上两点。
方法
Figure.1 MetaCHIP的workflow.
算法主要分为两部分:best-match + phylogeny.
- best-match:
- 将整个基因组数据中的ORF预测出来
- 将ORFs两两用BLASTN比对,经过参数筛选后,得到两两的matches。
- 将所有genomes分成group(按照分类学注释分组,例如A,B,C,这里的group可以是class/order/genus层面),各组的一条genome分别叫Ax,By,Cz; 每条genome上的一个gene叫Ax-N,By-N,Cz-N; 假设A组中有个gene叫A1-01,它的BLASTN结果在每组match为IAx,IByÿ