- 博客(7)
- 收藏
- 关注
原创 GeoStab:Improving the prediction of protein stability changes upon mutations
本文章主要是将几何学习的模型(geometric-learning-based models)用于预测蛋白质在突变后的稳定性和功能变化具体来说,文章提出了三个模型——GeoFitness。
2024-04-08 15:56:46 720 1
原创 Transfer learning to leverage larger datasets for improved prediction of protein stability changes
蛋白质在临床、工业和研究领域中的重要性和多样性,强调了蛋白质在生物学和医学中的关键作用。大型语言模型(LLMs)进行蛋白质结构预测,以及通过迁移学习完成各种蛋白质设计任务,包括基于序列的稳定性预测都取得了一定成就。proteinMPNN基于从PDB中发现的天然蛋白质中学到的结构模式,预测了给定位置所有20种氨基酸作为原始残基的概率。然而,通过生物自然进化来优化的稳定性只是在生存情况下够用,所以仅用proteinMPNN预测DDG°值可能不足以实现很好的性能。
2024-04-08 14:50:23 1056 3
原创 ProteinMPNN: Robust deep learning–based protein sequence design using ProteinMPNN 的前置知识及名词解释
Rosetta基于物理的方法将序列设计视为能量优化问题本文用到了MPNN with 3 encoder and 3 decoder layers and 128 hidden dimensions。
2024-04-08 14:48:56 1571
原创 ESM Biological structure and function emerge from scaling unsupervised learning
我们在这里的重点将是将一个单一的模型适合于跨越进化的许多不同的序列。在蛋白质序列中可能存在各种随机的扰动,但进化倾向于选择那些与生物适应性(fitness)一致的扰动(换句话说,生物在进化过程中更可能选择对其生存和繁殖有利的蛋白质序列变异,这些变异使得生物更适应其所处的环境和生存条件。(适者生存:Survival of the fittest)
2024-03-29 16:23:06 683 1
原创 【NLP】数据集准备GSAP-NER
数据集原材料的14%由三位标注员联合进行标注,下图左侧表格是人工标注的F1score(一个标注者是基准标注,另一个是预测标注,然后反转它们的角色。部分重叠的跨度视为匹配,不将不同的标注边界视为错误。下图右侧表格是标注好后数据集信息的统计。unique表示整个数据集中只有一个,比如ABCmodel在所有文章中只出现了一次,那么它就是unique。
2023-12-29 22:28:59 859
原创 【CV】MMDetction(MMCV)安装踩坑
这个博主的思路于是在确定版本的时候,便可以先选择硬件允许的尽量高的CUDA版本,然后去pytorch官网查找可安装的尽可能高的pytorch版本,之后再把这两个版本填入以下连接https://download.openmmlab.com/mmcv/dist/cu版本/torch版本/index.html。
2023-12-29 20:35:37 1588
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人