蛋白质结构预测
写在前面
开源链接: https://github.com/deepmind/alphafold
论文链接:https://www.nature.com/articles/s41586-021-03819-2_reference.pdf
一、what is embedding?
embedding在深度学习领域的最初切入点是manifold hypothesis(流形假设):自然的原始数据是低纬的流形嵌入于(embedding into)原始数据所在的高维空间(比如一个三维球体上的每一个点都可以用二维经纬度来表示)。在深度学习中,embedding是将高纬的原始数据(图像,句子)映射到低维流形(比如映射为一个表征向量)并使其变得可分。
二、基础知识
1.蛋白质结构
蛋白质预测任务的定义:输入氨基酸序列,预测其三维结构坐标(即蛋白质中每个原子的三维坐标)。碳基生物中的NH2-CH-COOH