课程地址:山东大学生物信息学
文章目录
四、蛋白质结构预测与分析
4.1 蛋白质的二级结构
常见的二级结构单元
-
详见视频:蛋白质的二级结构-01 P73
-
螺旋:最常见的就是 α 螺旋。还有三转角螺旋、五转角螺旋等。
-
β 折叠 (
βsheet
) : β 折叠由 β 折片 (β-strand
) 平行排列而成。序列上可能相隔很远,但空间上并排在一起,彼此间形成氢键。 -
无规卷曲 (
coil
): 无规律松散结构。 -
β 转角 (
turn
) : 如果肽链发生了急转弯(角度大于 90°),这个转弯结构叫 β 转角。
-
蛋白质的二级结构常用图形或字母形式来描述:
H:螺旋
E:β 折叠
T:代表转角
空白:松散的 coil 结构
-
DSSP (Definition of Secondary Structure of Proteins),即,蛋白质二级结构定义词典。DSSP 并不预测二级结构,而是根据二级结构的定义对已经测定三级结构的蛋白质的各个位置指认出是哪种二级结构。
DSSP 网址:http://swift.cmbi.ru.nl/gv/dssp
-
直接下载 PDB 中已有结构的 DSSP 文件:
http://www.pdb.org/pdb/files/3cig.dssp (替换结构名 3cig 即可)
ftp://ftp.cmbi.ru.n/pub/molbioldata/dssp/3cig.dssp
从 PDB 获取蛋白质二级结构信息
- 详见视频:蛋白质的二级结构-02 PDB P74
- PDB 数据库里存储的所有蛋白质的一级结构和二级结构都以 FASTA 的格式存储在一个叫做 “ss.txt” 的文本文件里(文件很大,使用不方便)。
http://www.rcsb.org/pdb/files/ss.txt
http://www.rcsb.org/pdb/files/ss.txt.gz (压缩文件 30.6M) - 自编程序 Biotools(打不开)http://1.51.215.28/~gongj/biotools/
输入 PDB ID 自动从网上获取 dssp 文件并抽取出一级和二级结构的序列信息。
预测蛋白质二级结构
- 详见视频:蛋白质的二级结构-03 PDB P75
- 对于未知结构的蛋白质,可以通过氨基酸序列,预测其二级结构。目前的二级结构预测软件只预测 α 螺旋和 β 折叠,不预测其他二级结构单元。
- 常用软件:
PSIPRED http://bioinf.cs.ucl.ac.uk/psipred
Jpred3 http://www.compbio.dundee.ac.uk/www-jpred/
PREDICTPROTEIN http://www.predictprotein.org/
SSpro http://scratch.proteomics.ics.uci.edu/
PSSpred http://zhanglab.ccmb.med.umich.edu/PSSpred/
PREDATOR http://mobyle.pasteur.fr/cgi-bin/portal.py?#forms::predator
GOR V http://gor.bb.iastate.edu/
4.2 蛋白质的三级结构
- 三级结构是指整条多肽链的三维空间结构,即,包括骨架和侧链在内的所有原子的空间排列。
- 测定三级结构的方法:X 射线衍射法(X-ray Crystallography)、核磁共振法(NMR,Nuclear Magnetic Resonance)、冷冻电子显微镜技术等。
- PDB 中绝大多数蛋白质的三级结构是用 X 射线衍射法测定的。
- 无法结晶的蛋白质可以利用核磁共振法在液体环境中测定(只能用于测定质量小于 70kD 的分子,约 200 多个氨基酸的蛋白质)。
- 详见视频:蛋白质的三级结构 PDB P76
- PDB 还可以通过序列相似性搜索获得与输入序列同源的蛋白质的三级结构。
- 下载 PDB 文件,用于后续三维可视化软件读取。