wangpan007-CSDN博客

原创论文解读：ProteinBERT: a universal deep-learning model of protein sequence and function

目录1. 研究背景2. 研究数据2.1 预训练的蛋白质数据集2.2 蛋白质基准数据集3. 研究方法3.1 序列和标注编码3.2 蛋白质序列和注释的自我监督预训练3.3 对蛋白质基准进行监督微调3.4 深度学习框架4. 结果4.1 预训练可以改善蛋白质模型4.2 ProteinBERT在不同的蛋白质基准上达到了近乎最先进的结果4.4 全局注意力机制的理解5. 结论作者单位：耶路撒冷希伯来大学发表期刊：《Bioinformatics》，2020年期刊影响因子：6.937发表时间：2022年1月9日数据和

2022-03-03 19:21:19 9249 6

原创论文解读：学习蛋白质的空间结构可以提高蛋白质相互作用的预测

文章目录论文概况1. 研究背景2. 研究数据2.1 种内数据集2.2 种间数据集2.3 多类别数据集3. 研究方法3.1数据预处理3.2局部特征提取3.3 结构特征提取3.3.1 构建预测接触图3.3.2 图表示学习3.4 预测模块4. 结果4.1 种内数据集上的性能比较4.1.1四个种内数据集性能比较4.1.2与其他算法比较4.2 多物种数据集的性能比较4.2.1 不同阈值的序列同一性比较4.2.2 TAGPPI与PIPR方法比较4.3 多类别数据集性能比较4.4 消融实验4.4.1TextCNN和图注意

2022-01-15 18:36:37 3498 6

原创论文解读：基于BERT和二维卷积神经网络的迁移结构，从序列信息中识别DNA增强子

文章目录论文基本情况1. 研究背景2. 实验数据3. 实验方法3.1 数据预处理3.2 BERT算法应用论文基本情况作者单位：台湾省台北医科大学发表期刊：《Briefings in Bioinformatics》，2020年期刊影响因子：11.622数据和代码：https://github.com/khanhlee/bert-enhancer1. 研究背景生物背景：增强子是DNA上一小段可与蛋白质结合的区域，与蛋白质结合之后，基因的转录作用将会加强。增强子可能位于基因上游，也可能位于下游。算法背

2021-10-31 20:38:40 1388

原创论文解读：BERT-Kcr: Prediction of lysine crotonylation sites by a transfer learning method

目录论文基本情况1. 研究背景2. 研究进展3. 实验数据3.1 赖氨酸巴豆酰化数据集3.2 赖氨酸糖化和乙酰化数据集4. 实验方法4.1 BERT特征编码4.2 分类器模型5. 研究结果5.1滑动窗口大小的选择5.2 不同BERT预训练模型比较5.3 不同NLP模型比较5.4 BERT模型的优化论文基本情况作者单位：清华大学生命科学学院、安徽农业大学。发表期刊情况：《Bioinformatics》，2020年影响因子：6.937。代码链接： http://zhulab.org.cn/BERT-Kc

2021-10-29 10:52:33 1595

原创论文解读：An Interpretable Prediction Model for Identifying N7-Methylguanosine Sites Based on XGBoost

目录论文简介1. 背景2. 数据3. 方法3.1 概述3.3 特征编码方法3.3.1 Binary Encoding3.3.2 CKSNAP3.3.3 ENAC3.3.4 NCP3.3.5 ND3.3.6 SCPseDNC3.4 XGBoost算法3.5 SHAP算法4 结果4.1 与其他现今算法比较4.1.1 交叉验证4.1.2 T检验4.2 特征编码对模型预测的影响4.2.1 最好的20个特征的影响4.2.2 去除这最好20个特征后的影响4.3 特征选择评价指标的影响4.4 与iRNA-m7G比较5 结

2021-10-03 19:13:47 790

原创论文解读：Attention-based convolutional neural networks for protein-protein interaction site prediction

文章目录论文简介1. 背景2. 数据2.1 输入的特征3. 方法4. 结果论文简介作者单位：郑州大学论文状态：在bioRxiv发布了预印本1. 背景从蛋白质序列中准确预测蛋白质-蛋白质相互作用位点(PPIs)有助于我们对蛋白质-蛋白质相互作用的理解，有助于蛋白质-蛋白质对接，对药物设计至关重要。2. 数据我们使用了与最先进的方法DeepPPISP相同的蛋白质序列，包括三个基准数据集Dset_186、Dset_72和Dset_164，如下表所示：2.1 输入的特征3. 方法4. 结果

2021-09-15 13:00:11 1073

原创论文解读：DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences

DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences论文导读1. 论文基本信息2. 生物背景2.1 研究问题3. 实验数据4. 实验方法4.1 模型4.2 A-DNA、B-DNA和ssDNA相互作用指标5. 结果5.1 对A-DNA，B-DNA和SSDNA结合残基预测的比较评估5.2 分析和评价交叉预测5.3 RNA结合蛋白交叉预测的评估5.4 dsDNA和ssDNA结合蛋白预测的比较

2021-09-12 18:36:23 493 1

原创论文解读：A novel antibacterial peptide recognition algorithm based on BERT

A novel antibacterial peptide recognition algorithm based on BERT论文概述1. 论文基本信息2. 生物背景2.1 肽的理解2.2 抗菌肽的理解2.3 论文解决的问题3. 实验数据3.1 引用的数据集3.2 作者自己处理的数据集4. 方法4.1 数据预处理4.2 预训练4.3 微调4.4 预测5. 结果5.1 对比其他方法独立测试结果5.2. 预训练对实验结果的影响5.3 平衡数据对微调模型的影响5.4 训练得到一个通用模型6. 结论论文概述

2021-08-15 19:15:33 1144

原创 BERT代码解读

文章目录本文框架1. BERT定义2. BERT实现2.1 BERT输入2.1.1 Token Embeddings（input_ids）2.1.2. Segment Embeddings（token_type_ids）2.1.3 Position Embeddings（attention_mask）2.2 预训练2.2.1 获取序列的embeddings2.2.2 利用Transformer对序列进行编码3.我的做法4. 结果5. 下一步打算本文框架1. BERT定义BERT全称Bidirecti

2021-08-01 18:43:08 5826 2

原创 LBERT: Lexically aware Transformer-based Bidirectional Encoder Representation model for learning

目录论文简介摘要：1. 介绍2. 数据3. 方法3.1 LBET模型3.1.1 LBET的发展背景3.1.2 BERT算法理解3.1.3 词汇模式表示法3.1.4 距离引导注意机制论文简介作者单位：台湾省阳明大学生物信息研究所论文地址：链接代码地址：链接期刊分区及影响因子：摘要：饿到一个通用的自然语言处理的技术（LBET）来解决生物实体关系提取（BRE）。概念理解：LBET：基于词汇感知变压器的双向编码器表示，带有词法嵌入和距离注意力机制的BERT算法。BRE：生物实体关系提取是一

2021-07-04 19:27:28 820

原创论文解读：Prediction of Protein–Protein Interaction Sites Using Convolutional Neural Network

目录论文简介摘要相互作用残基对的定义数据集论文简介论文代码： https://github.com/Xiaoya-Deng/PPI-sites-prediction论文原文：https://www.mdpi.com/1422-0067/21/2/467补充材料： http://www.mdpi.com/1422-0067/21/2/467/s1作者单位：重庆邮电大学期刊影响因子：4.556（中科院二区）摘要提出一种卷积神经网络用于PPI站点预测，并利用残基结合倾向来改善阳性样本。该方法在改进

2021-06-06 15:37:49 1324

原创论文笔记：EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning

文章目录论文概况摘要1 介绍2 方法2.1 特征表示2.1.1 蛋白质的图表示2.2 EGAT的结构2.2.2 边缘聚合图关注层2.2.3 预测概率2.2.4 EGAT结构图2.3 EGAT端到端的结构2.4 GAT-PPI:基于GAT的没有边聚合PPI预测3 结果和讨论3.1 数据3.2 结果3.2.1 与其他先进方法独立测试比较3.3 长期相互作用对PPI站点预测的影响3.4 基于 ProtBERT特征的迁移学习的影响3.5 边的可解释性和注意力得分4 总结论文概况原文链接：https://w

2021-04-24 20:24:46 5040 1

原创论文笔记：Residual spatiotemporal autoencoder for unsupervised video anomaly detection

文章目录摘要一、介绍二、剩余时空自动编码器三、基于剩余时空自编码器(r - state)的正态性建模四、结果和数据（一）、数据集（二）、预处理和训练（三）、结果（四）、参数对结果的影响五、结论摘要使用一种正态建模方法来解决数据集中异常行为比较少的问题，其中异常被检测为偏离正常模式，基于这个问题提出了一种残差时空自编码器，用来检测视频中的异常检测，利用重建损失检测不规则帧，其中正常帧以较低的重建成本被很好地重建，反之则被识别为异常帧，通过与现有方法的比较，证明了剩余块（residual blocks）的

2021-04-21 14:20:51 1254 1

原创利用XGBoost特征选择和堆叠集成分类器提高蛋白质-蛋白质相互作用预测精度

文章目录论文基本情况一、论文创新点：二、方法(一)、特征提取方法(二）、XGBoost特征选择（三）、叠迭分类器：三、数据四、实验结果（一）参数的确定（m=9）（二）、基分类器确定，元分类器比较论文基本情况期刊：《Computers in Biology and Medicine》影响因子及中科院分区：IF： 3.434，中科院三区发表日期：2020年7月作者单位：青岛科技大学代码地址： https://github.com/QUST-AIBBDRC/StackPPI/原文链接：https:

2021-03-31 19:13:26 1758

原创论文笔记：DeepEP: a deep learning framework for identifying essential proteins

论文笔记：DeepEP: a deep learning framework for identifying essential proteins一、论文创新二、方法（一）、网络结构（二）、Node2vec得到拓扑特征(三）、采样方法三、数据四、结果一、论文创新1.通过得到了得到了蛋白质的拓扑特征。2.采用了一种采样方法有效的解决了重要蛋白质和不重要蛋白质的失衡问题。二、方法（一）、网络结构提出了一种新的深度学习架构，DeeEP1.网络有两部分组成：特征提取和分类2.PPI网络的蛋白质拓

2021-03-07 19:09:57 957 3

原创论文：Developing Computational Model to Predict Protein-Protein Interaction Sites Based on the XGBoost

文章目录简介一、论文创新点二、介绍三、结果（一）、两种平衡模式下的预测性能（二）、不平衡和平衡数据集的比较四、讨论（一）、与其他方法比较（二）、独立基准数据集的预测性能（三）、实验结果可视化（四）、预测验证的极限简介发表期刊：《International Journal of Molecular Sciences》（生物二区，期刊2019年影响因子：4.556）论文网址：https://www.mdpi.com/1422-0067/21/7/2274论文作者学校：安徽科技大学一、论文创新点提出了

2021-01-30 00:17:22 624

原创论文笔记：EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein In

文章目录一、摘要二、方法（一）、蛋白质图的表示（二）、节点级特征表示（三）、边级特征表示（四）、 EGAT结构的主要特点（五）、边缘聚合图关注层（六）、在计算注意力分数时使用边缘特征三、结果（一）、数据集（二）、基准数据集上的结果（三）使用基于 ProtBERT的特性进行迁移学习的影响四、总结一、摘要图神经网络(GNN)已成为结构信息编码的一种有效工具，尽管基于GNN的体系结构已被应用于配对结合位点预测，但他没有被用来预测单个蛋白质的结合位点。此外，与可能不适当编码远程相互作用的残基特异性信息的方法不同

2021-01-20 19:01:15 3294

原创论文笔记：Protein-protein interaction site prediction through combining local and global features

文章目录一、论文基本情况二、前言三、数据（一）训练集和测试集（二）特征四、方法（一）局部特征（二）全局特征（三）文本卷积神经网络(TextCNN)五、模型的应用域（AD）（二）、全局特征的重要性（三）预测准确的情况（四）不同长度蛋白质的影响七、总结一、论文基本情况发表期刊：Bioinformatics（最新的IF=5.61）作者及单位：中南大学李敏团队服务器地址：http://bioinformatics.csu.edu.cn/PPISP/代码及数据地址：https://github.com/C

2021-01-03 19:52:50 3084 7

原创 DELPHI/predict.py代码解读

import numpy as npimport osimport loggingimport datetimefrom keras.models import load_modelimport timeimport argparseWINDOW_SIZE=31def Predict(args, test_all_features_np3D): log_time("Start predicting") if not os.path.exists(args.out_dir)

2020-11-21 20:50:33 377

原创 Shell 脚本中美元$符号应用

一、$的常用命令$0 shell的命令本身(包括完整路径)$1到$9 数字表示shell 的第几个参数 $# 传递到脚本的参数个数$* 以一个单字符串显示所有向脚本传递的参数$$ 脚本运行的ID号$! 后台运行的最后一个进程的ID号$@ 与$*相同。$- 显示shell使用的当前选项。$? 显示最后命令的执行状况。0表示没有错误。二、例子[qingxu@v020170 /tmp]$ ./test.sh p1 p2$0 is { ./test.sh }$1 i

2020-11-17 14:36:54 1628

原创 DELPHI.sh文件的理解

一、run_DELPHI.sh文件的理解#!/bin/bash#set -x# This is the DELPHI program entrance# Usage: ./run_DELPHI.sh [INPUT_FN]which python #查看python解释器的路径export INPUT_FN=$1 #export的作用表示新增一个INPUT_FN的环境变量，INPUT_FN这个变量表示输入蛋白质的序列，$1表示执行脚本的第一个参数。# OUT_DIR=${PRO_DIR}/tm

2020-11-17 11:47:37 166

原创查看CUDA和CUDNN是否安装成功（conda 环境）

方法一、conda list则说明CUDA和CUDNN已经配置成功方法二、nvcc -V如果安装成功会输出CUDA的版本信息（V要大写），如果没有安装nvcc，那么可以选择安装或者采用一方法，采用服务器可能出现没有权限的情况，需要得到root权限安装nvcc方法三、打开CUDA和CUDNN目录cat /usr/local/cuda/version.txt...

2020-11-12 11:16:26 72281 5

原创警告：RuntimeWarning: compiletime version 3.5 of module ‘tensorflow.python.framework

运行tensorflow代码的时候出现以下错误：RuntimeWarning: compiletime version 3.5 of module 'tensorflow.python.framework.fast_tensor_util' does not match runtime version 3.6解决方法一：忽略警告（警告信息，其实并不影响输出结果）输入以下TF调试代码有结果： import tensorflow as tf hello = tf.constant("Hell

2020-11-12 10:53:26 1497

原创 pycharm连接远程linux服务器的虚拟环境

一、前提条件1、确保linux服务器已经安装好虚拟环境，并且虚拟环境已经python的相关环境（连接服务器也可以进行环境配置）。2、通过Xsheel激活虚拟环境然后通过pip安装相关的包，当然也可以通过pycharm的terminal进行相关库安装。二、连接服务器1、进入pycharm的Tools栏2、选择文件传输协议为SFTP，输入服务器的IP、端口、密码进行连接，不出意外的情况下应该是能够连接成功的。3、选择本地和服务器的文件路径三、采用服务器的解释器1、file-setings

2020-11-12 10:39:52 4460 3

原创 linux远程服务器创建虚拟环境

一、通过anaconda安装前提条件：确保linux服务器已经安装了anaconda，如果没有安装可以参考其他博客进行安装。基本操作：1、创建虚拟环境conda create --name fantacy python=3.6.12 # 创建虚拟环境–name：也可以缩写为【-n】，【fantacy】是新创建的虚拟环境的名字,python=3.6.12：是python的版本号。若未指定，默认为当前环境的python版本.环境默认本地地址为：anaconda的目录下找到envs/fantac

2020-11-11 19:49:25 4052

原创论文笔记：DELPHI:预测蛋白质相互作用位点的精确深度集成模型

文章目录摘要：一、介绍二、材料和方法（一）、数据库（二）、测试集（三）、训练集和验证集（四）、输入特征（五）、模型架构（六）、CNN模型架构Web服务器：www.csd.uwo.ca/~yli922/index.php特征计算流水线:github.com/lucian-ilie/DELPHI联系邮箱： ilie@uwo.ca补充资料：摘要：动机：蛋白质通常通过与其他蛋白质相互作用来发挥功能，这就是为什么准确预测蛋白质-蛋白质相互作用(PPI)结合位点是一个基本问题。实验方法既缓慢又昂贵。因此，人

2020-11-07 21:11:10 6315 1

原创论文笔记：m6Acorr: an online tool for the correction and comparison of m6A methylation profiles

文章目录前言必备生物知识一、论文创新点二、背景前言论文发表期刊：《BMC BIOINFORMATICS》期刊影响因子：3.242期刊中科院分区：生物 3 区m6Acorr服务器： http://www.rnanut.net/m6Acorr校正函数及数据网址： https://github.com/emersON106/m6Acorr补充材料网址： https://doi.org/10.1186/s12859-020-3380-6作者简介：李建伟来自河北科技大学，黄燕来自北京大学必备生物知识

2020-10-14 11:16:48 865

原创论文笔记：A tractable latent variable model for nonlinear dimensionality reduction

文章目录一、论文基本信息二、摘要一、论文基本信息发表期刊：《Proceedings of the National Academy of Sciences of the United States of America》期刊最新影响因子:9.412中科院分区：综合性期刊 1 区论文作者及单位：加州大学圣地亚哥分校计算机科学与工程系劳伦斯·k·索尔（Lawrence K. Saul）出版日期:2020年6月24日原文链接：https://www.pnas.org/content/117/27/

2020-09-11 17:36:43 676

原创论文笔记：3D Residual Networks for Action Recognition（飞浆复现）

论文笔记：3D Residual Networks for Action Recognition（飞浆复现）文章目录1、 Abstract2、Introduction3、Related Work2.1.、Action Recognition Database2.2、 Action Recognition Approach3、3D Residual Networks3.1、Network Architecture4、Experiments5、Conclusion1、 Abstract具有时空三维核的卷积

2020-08-06 19:58:01 842

原创论文笔记：C2DNDA --A Deep Framework for Nonlinear Dimensionality Reduction

文章目录#一、论文概况：（一）、发表期刊：Ieee Transactions on Industrial Electronics（二）、最新影响因子:7.503（三）、原文链接：https://ieeexplore.ieee.org/abstract/document/8974600/#2、

2020-06-25 17:18:29 752 1

原创在GPU上使用Tensorflow出现：Cannot assign a device for operation strided_slice_2: node strided_slice_2 (defi

在GPU跑tensorflow出现了这个问题：Cannot assign a device for operation strided_slice_2: node strided_slice_2 (defined at D:\anaconda\lib\site-packages\tensorflow_core\python\framework\ops.py:1748) was explicitly assigned to /device:GPU:1 but available devices are [

2020-06-16 15:58:39 3020 2

wangpan007的博客