自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Seq-SetNet补充

在这里,我们将含有K个同源蛋白的MSA表示为K对齐,每个对齐由一个同源蛋白对齐到目标蛋白上。对于每个单独的比对,MSA编码器识别目标蛋白每个残基的突变,并将突变嵌入到64个特征的载体中。由于残基的变异与邻域残基的变异密切相关,因此MSA编码器在嵌入过程中应将感兴趣的残基与其邻域残基一起考虑。为此,我们将编码器设计为一个具有多个卷积层的一维卷积残差网络,从而使其能够将残差与其邻居嵌入在一起。

2023-08-14 18:20:22 58

原创 Seq-SetNet:直接利用多序列比对预测蛋白质二级结构

这里提出的蛋白质二级结构和扭转角预测的结果突出了直接使用MSA作为序列集的特殊功能。Seq-SetNet利用深度网络可以从复杂的MSA数据中自动提取相关特征的能力,而无需任何手工特征。虽然在概念验证研究中,我们展示了Seq-SetNet在预测残基的二级结构和扭转角中的应用,但该概念和基本思想可以扩展到阐明残基-残基接触和距离。在未来的研究中,这将被纳入Seq-SetNet,这将极大地促进蛋白质结构预测。

2023-05-19 12:08:49 1414 3

原创 基于改进通道注意力和多尺度卷积模块的蛋白质二级结构预测

为了防止预测模型随着权重的增加而过度拟合,本文根据二次结构的特点,引入了一种改进的交叉熵函数来提高预测模型的性能,使预测模型在one-hot分布和均匀分布的情况下都能得到满意的性能。每个氨基酸转换成大小为1×21(21:20个氨基酸和一个用X表示的未知氨基酸)的OneHot形式,其中只有两个元素,值为0或1,值1的位置对应氨基酸的类别。模型中一维卷积的运算过程如图所示,其中卷积信号为700×M矩阵,卷积信号的滤波器大小为N×M,因为输出大小取决于卷积信号的个数(R),所以输出信号的大小为700×R。

2023-05-13 11:14:30 897

原创 RGN2:基于语言模型和深度学习的单序列蛋白质结构预测

34%的目标的结构是使用NMR实验确定的,并用深灰色标记表示,而剩余的66%的目标是使用X射线晶体学或电子显微镜确定的。XRD,X射线晶体学。在本文中,我们描述了实施和培训的AminoBERT,使用Frenet-Serret公式在RGN 2和性能评估的天然和设计的蛋白质没有显着的序列同源物。作者对修订后的124个从头蛋白质靶点集和作者设计的蛋白质集(表A)进行了RGN2和ESM-1b之间的contact预测比较分析,这些表格显示了top L/2、L/5和L/10的contact的百分比精度。

2023-05-10 17:06:02 509

原创 孤儿蛋白质

孤儿”蛋白质是指同源物很少或没有同源物的蛋白质。比如:QrphaninFQ(1-11)

2023-05-10 11:20:51 151

原创 RGN2模型

换句话说就是,首先要对原始数据进行初步的处理,输入的不是直接的原始数据,而是在原始数据中人工参与提取的一些关键特征。而非端到端呢,就是输入不是直接的原始数据,而是在原始数据中提取的特征(如feature),这一点在图像问题上尤为突出。通过这种方式神经网络可以很好地学习到特征的描述,之前需要人工设计的特征算子,本身也可以通过神经网络的方式,让模型自己学习得到。端到端它缩减了人工预处理和后续的处理工作,尽可能使模型从原始输入到最终的输出,给模型更多可以根据数据自动调节的空间,增加了模型的整体契合度。

2023-05-10 11:14:22 129

原创 TextCNN

用TextCNN做新闻文本分类

2021-05-28 15:01:19 29

Sequoia-master.zip

Sequoia实现蛋白质二级结构预测

2023-08-17

利用BERT预测蛋白质二级结构

利用BERT预测蛋白质二级结构

2023-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除