点击蓝字↑↑↑“微生态”,轻松关注不迷路
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
只做宏基因组太单调?为什么不试试宏基因组Binning呢?一次测序,“宏基因组”+“Binning”两种分析,微生太帮您一站式处理宏基因组难题。现在,微生太免费向所有人分享Binning的整套分析流程,包含:生信分析代码和R语言绘图代码。我们一共设计了7个课时,每周一次,课表(进度)如下。
对Binning分析、R语言绘图感兴趣的朋友千万别错过。错过也没关系,每次课程不仅有回放,还有技术贴带您回顾课程内容。
图1
下面我们一起来回顾第四节课的主体内容吧。
一、分析内容
COG,即Clusters of OrthologousGroups of proteins(同源蛋白簇)。COG是由NCBI创建并维护的蛋白数据库,根据细菌、藻类和真核生物完整基因组的编码蛋白系统进化关系分类构建而成。COG分为两类,一类是原核生物的(一般称COG),另一类是真核生物(一般称KOG)。通过比对可以将某个蛋白序列注释到某一个COG中,每一簇COG由直系同源序列构成,从而可以推测该序列的功能。 ENZYME收录了7大类酶的四级分类信息。EC编号或EC号是酶学委员会(EnzymeCommission)为酶所制作的一套编号分类法,每一个酶的编号都以字母“EC”起头,接着以四个号码来表示,这些号码代表逐步更细致的为酶作出分类。 Ribosomal RNA genes (rRNA)、Transfer RNA genes (tRNA)、Non-coding RNA(ncRNA)分别使用RNAmmer、Aragorn、Infernal进行预测。COG官网:https://www.ncbi.nlm.nih.gov/COG/
COG注释信息:
http://eggnogdb.embl.de/download/eggnog_4.5/data/NO