COG数据库

COG数据库全称为clusterof orthologous group

访问网站为:https://www.ncbi.nlm.nih.gov/COG/

目前数据库更新到2020版本,下载链接为:Index of /pub/COG/COG2020/data(nih.gov)

下面简单介绍这些文件的主要内容

Readme.2020-11-25.txt 中展示对cog-20.cog.csv、fun-20.tab、cog-20.def.tab、cog-20.org.csv、cog-20.tax.csv、cog-20.fa.gz中数据的解读

Fasta文件夹主要包括fasta格式的蛋白序列和tsv格式的表格信息

其中表格信息包括蛋白ID 、蛋白长度、axid、基因名称以及footprint

cog-20.cog.csv

打开之后是这样的:

每列信息如下:

(1)基因ID (GenBank)

(2)NICBI Assembly ID

(3)蛋白ID(GenBank if conformsto [A-Za-z0-9_]+\.[0-9]+ regex; ad hoc otherwise)

(4)蛋白长度

(5)蛋白质上的 COG 足迹坐标。“201-400”表示“从位置201到位置400”;“1-100=201-300”表示分段足迹,1-100 和 201-300

(6)蛋白质上 COG 足迹的长度

(7)COG ID

(8)保守性

(9)COG 成员类别(0:足迹涵盖大部分蛋白质和大部分 COG 概况;1:足迹涵盖大部分蛋白质COG轮廓和部分蛋白质; 2:footprint覆盖大部分蛋白质和部分COGprofile; 3:蛋白质和 COG 概况部分匹配)

(10)蛋白质和 COG 配置文件匹配的 PSI-BLAST 位分数

(11)蛋白质和 COG 配置文件匹配的 PSI-BLAST e 值

(12)COG轮廓长度

(13)COG 剖面上的蛋白质足迹坐标

cog-20.def.tab

Tab-delimited plain text file with COGdescriptions

Columns:

1. COG ID

2. COG functional category (could includemultiple letters in the order of importance)

3. COG name

4. Gene associated with the COG (optional)

5. Functional pathway associated with theCOG (optional)

6. PubMed ID, associated with the COG(multiple entries are semicolon-separated; optional)

7. PDB ID of the structure associated withthe COG (multiple entries are semicolon-separated; optional)

Each line corresponds to one COG. The orderof the COGs is arbitrary (displayed in the lexicographic order)

cog-20.fa.gz解压得到cog-20.fa

FASTA 文件,包含所有 COG 的序列

>之后是蛋白ID(GenBank if conforms to [A-Za-z0-9_]+\.[0-9]+ regex; ad hocotherwise)

cog-20.org.csv

Comma-delimited plain text describinggenome assemblies

Columns:

1. NCBI Assembly ID

2. Organism (genome) name

3. NCBI Tax ID of the assembly

4. Taxonomic category used in COGs

cog-20.patt.txt

cog-20.tax.csv

Comma-delimited plain text describing taxonomiccategories

Columns:

1. Taxonomic category in COGs

2. Parent taxonomic category (self, if topof the hierarchy)

3. NCBI Tax ID of the assembly

Each line corresponds to one genometaxonomic category. The order of the taxonomic category is meaningful(determines the order ofdisplay)

fun-20.tab

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值