seowhi-CSDN博客

原创 Seq-SetNet补充

在这里，我们将含有K个同源蛋白的MSA表示为K对齐，每个对齐由一个同源蛋白对齐到目标蛋白上。对于每个单独的比对，MSA编码器识别目标蛋白每个残基的突变，并将突变嵌入到64个特征的载体中。由于残基的变异与邻域残基的变异密切相关，因此MSA编码器在嵌入过程中应将感兴趣的残基与其邻域残基一起考虑。为此，我们将编码器设计为一个具有多个卷积层的一维卷积残差网络，从而使其能够将残差与其邻居嵌入在一起。

2023-08-14 18:20:22 58

原创 Seq-SetNet：直接利用多序列比对预测蛋白质二级结构

这里提出的蛋白质二级结构和扭转角预测的结果突出了直接使用MSA作为序列集的特殊功能。Seq-SetNet利用深度网络可以从复杂的MSA数据中自动提取相关特征的能力，而无需任何手工特征。虽然在概念验证研究中，我们展示了Seq-SetNet在预测残基的二级结构和扭转角中的应用，但该概念和基本思想可以扩展到阐明残基-残基接触和距离。在未来的研究中，这将被纳入Seq-SetNet，这将极大地促进蛋白质结构预测。

2023-05-19 12:08:49 1414 3

原创基于改进通道注意力和多尺度卷积模块的蛋白质二级结构预测

为了防止预测模型随着权重的增加而过度拟合，本文根据二次结构的特点，引入了一种改进的交叉熵函数来提高预测模型的性能，使预测模型在one-hot分布和均匀分布的情况下都能得到满意的性能。每个氨基酸转换成大小为1×21（21:20个氨基酸和一个用X表示的未知氨基酸）的OneHot形式，其中只有两个元素，值为0或1，值1的位置对应氨基酸的类别。模型中一维卷积的运算过程如图所示，其中卷积信号为700×M矩阵，卷积信号的滤波器大小为N×M，因为输出大小取决于卷积信号的个数(R)，所以输出信号的大小为700×R。

2023-05-13 11:14:30 897

原创 RGN2：基于语言模型和深度学习的单序列蛋白质结构预测

34%的目标的结构是使用NMR实验确定的，并用深灰色标记表示，而剩余的66%的目标是使用X射线晶体学或电子显微镜确定的。XRD，X射线晶体学。在本文中，我们描述了实施和培训的AminoBERT，使用Frenet-Serret公式在RGN 2和性能评估的天然和设计的蛋白质没有显着的序列同源物。作者对修订后的124个从头蛋白质靶点集和作者设计的蛋白质集(表A)进行了RGN2和ESM-1b之间的contact预测比较分析，这些表格显示了top L/2、L/5和L/10的contact的百分比精度。

2023-05-10 17:06:02 509

原创孤儿蛋白质

孤儿”蛋白质是指同源物很少或没有同源物的蛋白质。比如：QrphaninFQ（1-11）

2023-05-10 11:20:51 151

原创 RGN2模型

换句话说就是，首先要对原始数据进行初步的处理，输入的不是直接的原始数据，而是在原始数据中人工参与提取的一些关键特征。而非端到端呢，就是输入不是直接的原始数据，而是在原始数据中提取的特征(如feature)，这一点在图像问题上尤为突出。通过这种方式神经网络可以很好地学习到特征的描述，之前需要人工设计的特征算子，本身也可以通过神经网络的方式，让模型自己学习得到。端到端它缩减了人工预处理和后续的处理工作，尽可能使模型从原始输入到最终的输出，给模型更多可以根据数据自动调节的空间，增加了模型的整体契合度。

2023-05-10 11:14:22 129

原创 TextCNN

用TextCNN做新闻文本分类

2021-05-28 15:01:19 29

qq_48188830的博客