在PDB(Protein Data Bank)数据库中,蛋白质结构文件通常以两种主要格式存储:.pdb(PDB格式)和 .cif(CIF格式,Crystallographic Information File)。这两种文件格式记录了蛋白质的三维结构坐标信息以及实验数据,但它们的表达方式和用途有所不同。
1. PDB数据库中的结构文件类型
- .pdb 文件:是最早期的蛋白质结构文件格式,使用简单的文本格式,逐行记录原子的空间坐标和其他实验信息。这种格式在过去几十年中被广泛使用。
- .cif 文件:全称为 mmCIF(macromolecular Crystallographic Information File),是目前推荐的标准格式。与
.pdb
文件相比,mmCIF
格式能够存储更多的详细信息,并且支持更大规模的结构数据。 .ent
文件的基本信息
在 PDB 数据库中,.ent
文件是蛋白质数据文件的另一种常见格式,它实际上是 PDB 格式(Protein Data Bank format)文件的文件扩展名之一。PDB 格式文件用于存储蛋白质、核酸等生物大分子的三维结构信息,通常通过实验方法(如 X 射线晶体学、核磁共振 NMR 或电子显微镜)解析获得。.ent
扩展名并不影响文件的格式和内容,与常见的 .pdb
文件内容完全一致。