2024学习笔记
文章平均质量分 94
文大于2
这个作者很懒,什么都没留下…
展开
-
计算生物学习——Code_创建异构图②
将ID列转换为类别型数据并将类别转换为数值编码的作用是将原本可能是字符串类型的ID(如。便于后续在图计算中处理这些ID,因为大多数图计算库(包括DGL)要求节点和边的ID是。:每种类型的边的数量。每种边类型由三元组(源节点类型,边类型,目标节点类型)表示。等)转换成数值类型。每个唯一值对应一个唯一的整数代码。:节点类型和边类型之间的关系。会被转换成相同的整数代码。每种类型的节点的数量。保持相同ID的一致性。原创 2024-07-30 18:42:00 · 849 阅读 · 0 评论 -
计算生物——Code_Pytorch框架——蛋白靶点小分子药物对接亲和力预测_CPU(07.11-07.22)
ESM2 模型设置## 加载本地的 tokenizer 和模型定义一个新的类,它继承自PyTorch的Dataset类。这个类用于创建一个自定义的数据集,可以与DataLoader一起使用来加载数据。__init__函数,用于初始化类的实例变量。data:包含数据的DataFrame。:将SMILES字符串转换为向量表示的函数。:将生物分子的序列转换为嵌入向量的函数。__len__返回数据集的长度,即数据集中样本的数量。获取数据集中的单个样本。根据索引ind。原创 2024-07-29 01:25:50 · 1134 阅读 · 0 评论 -
计算生物学习——Code_SMILES的向量表示_ChemBERTa(07.16)
模型在输入序列中随机遮盖(mask)一些令牌(tokens),然后预测这些被遮盖的令牌。参数越多,模型的容量越大,可以捕捉到更多的复杂特征,但也需要更多的计算资源来训练和推理。记得定义一下自己的local_model_path(文件夹(chemBERTa_files)所在的路径)这是在提示说我加载的模型不完整或有一些参数没有在预训练过程中保存下来。尝试加载模型时,遇到和之前一样的情况,用和之前一样ESM2的方法:本地加载。是模型池化层(pooler layer)的权重。根据错误信息,我加载的模型使用的是。原创 2024-07-17 17:57:56 · 1087 阅读 · 0 评论 -
计算生物学习——Code_ESM-2输出蛋白质的特征表示_解决无法用代码线上加载模型(06.20-06.21)
今天,根据大佬loong_XL指点去查看了源头代码,发现问题--解决问题原创 2024-06-21 17:22:29 · 3210 阅读 · 3 评论 -
计算生物学习——Code_PyTorch(06.15-06.19)
计算生物学习笔记1原创 2024-06-19 18:38:18 · 932 阅读 · 3 评论