本篇适合没有任何生物基础的纯小白。提供踏入生物数据分析行业(特别是蛋白质分析)所需要的最基础的知识,对生命活动方面内容不做特别深入,快速上手。
一、生命活动的基本知识
转录是指DNA中的遗传信息被转写成信使RNA(mRNA)。首先,DNA在细胞核内解开,RNA聚合酶将DNA的遗传信息复制到mRNA上。接下来,翻译是在细胞质中的核糖体上进行的,mRNA被核糖体读取,指导氨基酸通过转运RNA(tRNA)按顺序连接,形成蛋白质链。这个链最终折叠成蛋白质,执行各种生物功能。
在生物组学分析中:分别针对这三个部分进行解析,依次是:基因组,转录组,蛋白组。(还有针对小分子的代谢组)。
在翻译过程中,核糖体内,氨基酸通过脱水缩合反应连接起来,形成肽链。这种反应涉及一个氨基酸的氨基(-NH₂)和另一个氨基酸的羧基(-COOH)形成肽键,并释放出一分子水(H₂O),肽链再经过空间折叠形成蛋白质。
二、氨基酸(amino acid)
1.基本结构
氨基酸是构成蛋白质的基本单位,每个氨基酸都具有一个共同的基本结构,包括一个氨基(-NH₂)、一个羧基(-COOH)、一个氢原子以及一个侧链(R基团)。
2.分类
氨基酸的侧链(R基团)各不相同,决定了每种氨基酸的独特性质。例如极性、疏水性或酸碱性。在数据表示中,有三字母缩写和单字母缩写两种方式。
英文名 | 中文名 | 三字母缩写 | 单字母缩写 | 结构式 |
---|---|---|---|---|
Alanine | Ala | A | CH3-CH(NH2)-COOH | |
Arginine | Arg | R | HN=C(NH2)-NH-(CH2)3-CH(NH2)-COOH | |
Asparagine | Asn | N | H2N-CO-CH2-CH(NH2)-COOH | |
Asparticacid | Asp | D | HOOC-CH2-CH(NH2)-COOH | |
Cysteine | Cys | C | HS-CH2-CH(NH2)-COOH | |
Glutamine | Gln | Q | H2N-CO-(CH2)2-CH(NH2)-COOH | |
Glutamicacid | Glu | E | HOOC-(CH2)2-CH(NH2)-COOH | |
Glycine | Gly | G | NH2-CH2-COOH | |
Histidine | His | H | *NH-CH=N-CH=*C-CH2-CH(NH2)-COOH | |
Isoleucine | Ile | I | CH3-CH2-CH(CH3)-CH(NH2)-COOH | |
Leucine | Leu | L | (CH3)2CH-CH2-CH(NH2)-COOH | |
Lysine | Lys | K | H2N-(CH2)4-CH(NH2)-COOH | |
Methionine | (蛋氨酸) | Met | M | CH3-S-(CH2)2-CH(NH2)-COOH |
Phenylalanine | Phe | F | Ph-CH2-CH(NH2)-COOH | |
Proline | Pro | P | *NH-(CH2)3-*CH-COOH | |
Serine | Ser | S | HO-CH2-CH(NH2)-COOH | |
Threonine | Thr | T | CH3-CH(OH)-CH(NH2)-COOH | |
Tryptophan | Trp | W | *Ph-NH-CH=*C-CH2-CH(NH2)-COOH | |
Tyrosine | Tyr | Y | HO-p-Ph-CH2-CH(NH2)-COOH | |
Valine | Val | V | (CH3)2CH-CH(NH2)-COOH |
三、肽链(Polypeptide / peptide chain)
-
Cα
atom:蛋白质中每个氨基酸的主链上的一个碳原子。 -
Cβ
atom:Cα碳原子旁边的第一个C原子。(R基团中与Cα连接的碳原子) -
Amino acid residues
:多肽中的氨基酸单位称为氨基酸残基, 即由肽键连接的氨基酸失水后剩余部分。 -
N-terminus
:肽链的氨基端 -
C-terminus
:肽链的羧基端 -
peptide bond
:肽键,具有双键的一部分性质(不能旋转) -
dihedral angles
: (have a try)Phi(φ):
一个氨基酸残基的氮原子(N)与 Cα碳原子之间的二面角。Psi(ψ)
:Cα碳原子与其羰基碳原子(C=O)之间的二面角。
四、蛋白质(protein)
1.结构层次
结构总共分为四个层次(转载自百度百科):
-
一级结构:氨基酸序列。
-
二级结构:肽链主链骨架原子的空间结构。形式:α螺旋(a-helix),β折叠(3-strand),β转角(β-bend),Ω环(Ω loop),无规卷曲(randomcoil)。
-
三级结构:一条多肽链所有原子的空间排布。
-
四级结构:亚基与亚基之间特定的三维排布,以非共价键链接。
-
构象:蛋白质的空间结构。
-
亚基:每一条多肽链都有完整的三级结构。
多肽和蛋白质的区别在于:多肽分子量比较小,且多肽最多含有二级结构
2.性质区分
2.1 Protein stability(稳定性) thermostability(热稳定性)
蛋白质的稳定性是指的蛋白质维持三维结构的能力。蛋白质的热稳定性指的是蛋白质在高温下保持三维结构的能力。