- 博客(36)
- 收藏
- 关注
原创 论文解读:ProteinBERT: a universal deep-learning model of protein sequence and function
目录1. 研究背景2. 研究数据2.1 预训练的蛋白质数据集2.2 蛋白质基准数据集3. 研究方法3.1 序列和标注编码3.2 蛋白质序列和注释的自我监督预训练3.3 对蛋白质基准进行监督微调3.4 深度学习框架4. 结果4.1 预训练可以改善蛋白质模型4.2 ProteinBERT在不同的蛋白质基准上达到了近乎最先进的结果4.4 全局注意力机制的理解5. 结论作者单位:耶路撒冷希伯来大学发表期刊:《Bioinformatics》,2020年期刊影响因子:6.937发表时间:2022年1月9日数据和
2022-03-03 19:21:19 7385 3
原创 论文解读:学习蛋白质的空间结构可以提高蛋白质相互作用的预测
文章目录论文概况1. 研究背景2. 研究数据2.1 种内数据集2.2 种间数据集2.3 多类别数据集3. 研究方法3.1数据预处理3.2局部特征提取3.3 结构特征提取3.3.1 构建预测接触图3.3.2 图表示学习3.4 预测模块4. 结果4.1 种内数据集上的性能比较4.1.1四个种内数据集性能比较4.1.2与其他算法比较4.2 多物种数据集的性能比较4.2.1 不同阈值的序列同一性比较4.2.2 TAGPPI与PIPR方法比较4.3 多类别数据集性能比较4.4 消融实验4.4.1TextCNN和图注意
2022-01-15 18:36:37 3164 6
原创 论文解读:基于BERT和二维卷积神经网络的迁移结构,从序列信息中识别DNA增强子
文章目录论文基本情况1. 研究背景2. 实验数据3. 实验方法3.1 数据预处理3.2 BERT算法应用论文基本情况作者单位:台湾省台北医科大学发表期刊:《Briefings in Bioinformatics》,2020年期刊影响因子:11.622数据和代码:https://github.com/khanhlee/bert-enhancer1. 研究背景生物背景:增强子是DNA上一小段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游。算法背
2021-10-31 20:38:40 1226
原创 论文解读:BERT-Kcr: Prediction of lysine crotonylation sites by a transfer learning method
目录论文基本情况1. 研究背景2. 研究进展3. 实验数据3.1 赖氨酸巴豆酰化数据集3.2 赖氨酸糖化和乙酰化数据集4. 实验方法4.1 BERT特征编码4.2 分类器模型5. 研究结果5.1滑动窗口大小的选择5.2 不同BERT预训练模型比较5.3 不同NLP模型比较5.4 BERT模型的优化论文基本情况作者单位:清华大学生命科学学院、安徽农业大学。发表期刊情况:《Bioinformatics》,2020年影响因子:6.937。代码链接: http://zhulab.org.cn/BERT-Kc
2021-10-29 10:52:33 1334
原创 论文解读:An Interpretable Prediction Model for Identifying N7-Methylguanosine Sites Based on XGBoost
目录论文简介1. 背景2. 数据3. 方法3.1 概述3.3 特征编码方法3.3.1 Binary Encoding3.3.2 CKSNAP3.3.3 ENAC3.3.4 NCP3.3.5 ND3.3.6 SCPseDNC3.4 XGBoost算法3.5 SHAP算法4 结果4.1 与其他现今算法比较4.1.1 交叉验证4.1.2 T检验4.2 特征编码对模型预测的影响4.2.1 最好的20个特征的影响4.2.2 去除这最好20个特征后的影响4.3 特征选择评价指标的影响4.4 与iRNA-m7G比较5 结
2021-10-03 19:13:47 662
原创 论文解读:Attention-based convolutional neural networks for protein-protein interaction site prediction
文章目录论文简介1. 背景2. 数据2.1 输入的特征3. 方法4. 结果论文简介作者单位:郑州大学论文状态:在bioRxiv发布了预印本1. 背景从蛋白质序列中准确预测蛋白质-蛋白质相互作用位点(PPIs)有助于我们对蛋白质-蛋白质相互作用的理解,有助于蛋白质-蛋白质对接,对药物设计至关重要。2. 数据我们使用了与最先进的方法DeepPPISP相同的蛋白质序列,包括三个基准数据集Dset_186、Dset_72和Dset_164,如下表所示:2.1 输入的特征3. 方法4. 结果
2021-09-15 13:00:11 962
原创 论文解读:DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences
DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences论文导读1. 论文基本信息2. 生物背景2.1 研究问题3. 实验数据4. 实验方法4.1 模型4.2 A-DNA、B-DNA和ssDNA相互作用指标5. 结果5.1 对A-DNA,B-DNA和SSDNA结合残基预测的比较评估5.2 分析和评价交叉预测5.3 RNA结合蛋白交叉预测的评估5.4 dsDNA和ssDNA结合蛋白预测的比较
2021-09-12 18:36:23 357 1
原创 论文解读:A novel antibacterial peptide recognition algorithm based on BERT
A novel antibacterial peptide recognition algorithm based on BERT论文概述1. 论文基本信息2. 生物背景2.1 肽的理解2.2 抗菌肽的理解2.3 论文解决的问题3. 实验数据3.1 引用的数据集3.2 作者自己处理的数据集4. 方法4.1 数据预处理4.2 预训练4.3 微调4.4 预测5. 结果5.1 对比其他方法独立测试结果5.2. 预训练对实验结果的影响5.3 平衡数据对微调模型的影响5.4 训练得到一个通用模型6. 结论论文概述
2021-08-15 19:15:33 797
原创 BERT代码解读
文章目录本文框架1. BERT定义2. BERT实现2.1 BERT输入2.1.1 Token Embeddings(input_ids)2.1.2. Segment Embeddings(token_type_ids)2.1.3 Position Embeddings(attention_mask)2.2 预训练2.2.1 获取序列的embeddings2.2.2 利用Transformer对序列进行编码3.我的做法4. 结果5. 下一步打算本文框架1. BERT定义BERT全称Bidirecti
2021-08-01 18:43:08 5444 2
原创 LBERT: Lexically aware Transformer-based Bidirectional Encoder Representation model for learning
目录论文简介摘要:1. 介绍2. 数据3. 方法3.1 LBET模型3.1.1 LBET的发展背景3.1.2 BERT算法理解3.1.3 词汇模式表示法3.1.4 距离引导注意机制论文简介作者单位:台湾省阳明大学生物信息研究所论文地址:链接代码地址:链接期刊分区及影响因子:摘要:饿到一个通用的自然语言处理的技术(LBET)来解决生物实体关系提取(BRE)。概念理解:LBET:基于词汇感知变压器的双向编码器表示,带有词法嵌入和距离注意力机制的BERT算法。BRE:生物实体关系提取是一
2021-07-04 19:27:28 730
原创 论文解读:Prediction of Protein–Protein Interaction Sites Using Convolutional Neural Network
目录论文简介摘要相互作用残基对的定义数据集论文简介论文代码: https://github.com/Xiaoya-Deng/PPI-sites-prediction论文原文:https://www.mdpi.com/1422-0067/21/2/467补充材料: http://www.mdpi.com/1422-0067/21/2/467/s1作者单位:重庆邮电大学期刊影响因子:4.556(中科院二区)摘要提出一种卷积神经网络用于PPI站点预测,并利用残基结合倾向来改善阳性样本。该方法在改进
2021-06-06 15:37:49 1205
原创 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning
文章目录论文概况摘要1 介绍2 方法2.1 特征表示2.1.1 蛋白质的图表示2.2 EGAT的结构2.2.2 边缘聚合图关注层2.2.3 预测概率2.2.4 EGAT结构图2.3 EGAT端到端的结构2.4 GAT-PPI:基于GAT的没有边聚合PPI预测3 结果和讨论3.1 数据3.2 结果3.2.1 与其他先进方法独立测试比较3.3 长期相互作用对PPI站点预测的影响3.4 基于 ProtBERT特征的迁移学习的影响3.5 边的可解释性和注意力得分4 总结论文概况原文链接:https://w
2021-04-24 20:24:46 3881 1
原创 论文笔记:Residual spatiotemporal autoencoder for unsupervised video anomaly detection
文章目录摘要一、 介绍二、剩余时空自动编码器三、基于剩余时空自编码器(r - state)的正态性建模四、结果和数据(一)、数据集(二)、预处理和训练(三)、结果(四)、参数对结果的影响五、结论摘要使用一种正态建模方法来解决数据集中异常行为比较少的问题,其中异常被检测为偏离正常模式,基于这个问题提出了一种残差时空自编码器,用来检测视频中的异常检测,利用重建损失检测不规则帧,其中正常帧以较低的重建成本被很好地重建,反之则被识别为异常帧,通过与现有方法的比较,证明了剩余块(residual blocks)的
2021-04-21 14:20:51 1082 1
原创 利用XGBoost特征选择和堆叠集成分类器提高蛋白质-蛋白质相互作用预测精度
文章目录论文基本情况一、论文创新点:二、方法(一)、特征提取方法(二)、XGBoost特征选择(三)、叠迭分类器:三、数据四、实验结果(一)参数的确定(m=9)(二)、基分类器确定,元分类器比较论文基本情况期刊:《Computers in Biology and Medicine》影响因子及中科院分区:IF: 3.434,中科院三区发表日期:2020年7月作者单位:青岛科技大学代码地址: https://github.com/QUST-AIBBDRC/StackPPI/原文链接:https:
2021-03-31 19:13:26 1547
原创 论文笔记:DeepEP: a deep learning framework for identifying essential proteins
论文笔记:DeepEP: a deep learning framework for identifying essential proteins一、论文创新二、方法(一)、网络结构(二)、Node2vec得到拓扑特征(三)、采样方法三、数据四、结果一、论文创新1.通过得到了得到了蛋白质的拓扑特征。2.采用了一种采样方法有效的解决了重要蛋白质和不重要蛋白质的失衡问题。二、方法(一)、网络结构提出了一种新的深度学习架构,DeeEP1.网络有两部分组成:特征提取和分类2.PPI网络的蛋白质拓
2021-03-07 19:09:57 523 3
原创 论文:Developing Computational Model to Predict Protein-Protein Interaction Sites Based on the XGBoost
文章目录简介一、论文创新点二、介绍三、结果(一)、两种平衡模式下的预测性能(二)、不平衡和平衡数据集的比较四、讨论(一)、与其他方法比较(二)、独立基准数据集的预测性能(三)、实验结果可视化(四)、预测验证的极限简介发表期刊:《International Journal of Molecular Sciences》(生物二区,期刊2019年影响因子:4.556)论文网址:https://www.mdpi.com/1422-0067/21/7/2274论文作者学校:安徽科技大学一、论文创新点提出了
2021-01-30 00:17:22 536
原创 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein In
文章目录一、摘要二、方法(一)、蛋白质图的表示(二)、节点级特征表示(三)、边级特征表示(四)、 EGAT结构的主要特点(五)、边缘聚合图关注层(六)、在计算注意力分数时使用边缘特征三、结果(一)、数据集(二)、基准数据集上的结果(三)使用基于 ProtBERT的特性进行迁移学习的影响四、总结一、摘要图神经网络(GNN)已成为结构信息编码的一种有效工具,尽管基于GNN的体系结构已被应用于配对结合位点预测,但他没有被用来预测单个蛋白质的结合位点。此外,与可能不适当编码远程相互作用的残基特异性信息的方法不同
2021-01-20 19:01:15 2839
原创 论文笔记:Protein-protein interaction site prediction through combining local and global features
文章目录一、论文基本情况二、前言三、数据(一)训练集和测试集(二)特征四、方法(一)局部特征(二)全局特征(三)文本卷积神经网络(TextCNN)五、模型的应用域(AD)(二)、全局特征的重要性(三)预测准确的情况(四)不同长度蛋白质的影响七、总结一、论文基本情况发表期刊:Bioinformatics(最新的IF=5.61)作者及单位:中南大学李敏团队服务器地址:http://bioinformatics.csu.edu.cn/PPISP/代码及数据地址:https://github.com/C
2021-01-03 19:52:50 2834 6
原创 DELPHI/predict.py代码解读
import numpy as npimport osimport loggingimport datetimefrom keras.models import load_modelimport timeimport argparseWINDOW_SIZE=31def Predict(args, test_all_features_np3D): log_time("Start predicting") if not os.path.exists(args.out_dir)
2020-11-21 20:50:33 345
原创 Shell 脚本中美元$符号应用
一、$的常用命令$0 shell的命令本身(包括完整路径)$1到$9 数字表示shell 的第几个参数 $# 传递到脚本的参数个数$* 以一个单字符串显示所有向脚本传递的参数$$ 脚本运行的ID号$! 后台运行的最后一个进程的ID号$@ 与$*相同。$- 显示shell使用的当前选项。$? 显示最后命令的执行状况。0表示没有错误。二、例子[qingxu@v020170 /tmp]$ ./test.sh p1 p2$0 is { ./test.sh }$1 i
2020-11-17 14:36:54 1562
原创 DELPHI.sh文件的理解
一、run_DELPHI.sh文件的理解#!/bin/bash#set -x# This is the DELPHI program entrance# Usage: ./run_DELPHI.sh [INPUT_FN]which python #查看python解释器的路径export INPUT_FN=$1 #export的作用表示新增一个INPUT_FN的环境变量,INPUT_FN这个变量表示输入蛋白质的序列,$1表示执行脚本的第一个参数。# OUT_DIR=${PRO_DIR}/tm
2020-11-17 11:47:37 150
原创 查看CUDA和CUDNN是否安装成功(conda 环境)
方法一、conda list则说明CUDA和CUDNN已经配置成功方法二、nvcc -V如果安装成功会输出CUDA的版本信息(V要大写),如果没有安装nvcc,那么可以选择安装或者采用一方法,采用服务器可能出现没有权限的情况,需要得到root权限安装nvcc方法三、打开CUDA和CUDNN目录cat /usr/local/cuda/version.txt...
2020-11-12 11:16:26 68505 2
原创 警告:RuntimeWarning: compiletime version 3.5 of module ‘tensorflow.python.framework
运行tensorflow代码的时候出现以下错误:RuntimeWarning: compiletime version 3.5 of module 'tensorflow.python.framework.fast_tensor_util' does not match runtime version 3.6解决方法一:忽略警告(警告信息,其实并不影响输出结果)输入以下TF调试代码有结果 : import tensorflow as tf hello = tf.constant("Hell
2020-11-12 10:53:26 1392
原创 pycharm连接远程linux服务器的虚拟环境
一、前提条件1、确保linux服务器已经安装好虚拟环境,并且虚拟环境已经python的相关环境(连接服务器也可以进行环境配置)。2、通过Xsheel激活虚拟环境然后通过pip安装相关的包,当然也可以通过pycharm的terminal进行相关库 安装。二、连接服务器1、进入pycharm的Tools栏2、选择文件传输协议为SFTP,输入服务器的IP、端口、密码进行连接,不出意外的情况下应该是能够连接成功的。3、选择本地和服务器的文件路径三、采用服务器的解释器1、file-setings
2020-11-12 10:39:52 3961 3
原创 linux远程服务器创建虚拟环境
一、通过anaconda安装前提条件:确保linux服务器已经安装了anaconda,如果没有安装可以参考其他博客进行安装。基本操作:1、创建虚拟环境conda create --name fantacy python=3.6.12 # 创建虚拟环境–name:也可以缩写为 【-n】,【fantacy】是新创建的虚拟环境的名字,python=3.6.12:是python的版本号。若未指定,默认为当前环境的python版本.环境默认本地地址为:anaconda的目录下找到envs/fantac
2020-11-11 19:49:25 3610
原创 论文笔记:DELPHI:预测蛋白质相互作用位点的精确深度集成模型
文章目录摘要:一、介绍二、材料和方法(一)、数据库(二)、测试集(三)、训练集和验证集(四)、输入特征(五)、模型架构(六)、CNN模型架构Web服务器:www.csd.uwo.ca/~yli922/index.php特征计算流水线:github.com/lucian-ilie/DELPHI联系邮箱: ilie@uwo.ca补充资料:摘要:动机:蛋白质通常通过与其他蛋白质相互作用来发挥功能,这就是为什么准确预测蛋白质-蛋白质相互作用(PPI)结合位点是一个基本问题。实验方法既缓慢又昂贵。因此,人
2020-11-07 21:11:10 5826 1
原创 论文笔记:m6Acorr: an online tool for the correction and comparison of m6A methylation profiles
文章目录前言必备生物知识一、论文创新点二、背景前言论文发表期刊:《BMC BIOINFORMATICS》期刊影响因子:3.242期刊中科院分区:生物 3 区m6Acorr服务器: http://www.rnanut.net/m6Acorr校正函数及数据网址: https://github.com/emersON106/m6Acorr补充材料网址: https://doi.org/10.1186/s12859-020-3380-6作者简介:李建伟来自河北科技大学,黄燕来自北京大学必备生物知识
2020-10-14 11:16:48 747
原创 论文笔记:A tractable latent variable model for nonlinear dimensionality reduction
文章目录一、论文基本信息二、摘要一、论文基本信息发表期刊:《Proceedings of the National Academy of Sciences of the United States of America》期刊最新影响因子:9.412中科院分区:综合性期刊 1 区论文作者及单位:加州大学圣地亚哥分校计算机科学与工程系劳伦斯·k·索尔(Lawrence K. Saul)出版日期:2020年6月24日原文链接:https://www.pnas.org/content/117/27/
2020-09-11 17:36:43 599
原创 论文笔记:3D Residual Networks for Action Recognition(飞浆复现)
论文笔记:3D Residual Networks for Action Recognition(飞浆复现)文章目录1、 Abstract2、Introduction3、Related Work2.1.、Action Recognition Database2.2、 Action Recognition Approach3、3D Residual Networks3.1、Network Architecture4、Experiments5、Conclusion1、 Abstract具有时空三维核的卷积
2020-08-06 19:58:01 709
原创 论文笔记:C2DNDA --A Deep Framework for Nonlinear Dimensionality Reduction
文章目录#一、论文概况:(一)、发表期刊:Ieee Transactions on Industrial Electronics(二)、最新影响因子:7.503(三)、原文链接:https://ieeexplore.ieee.org/abstract/document/8974600/#2、
2020-06-25 17:18:29 645 1
原创 在GPU上使用Tensorflow出现:Cannot assign a device for operation strided_slice_2: node strided_slice_2 (defi
在GPU跑tensorflow出现了这个问题:Cannot assign a device for operation strided_slice_2: node strided_slice_2 (defined at D:\anaconda\lib\site-packages\tensorflow_core\python\framework\ops.py:1748) was explicitly assigned to /device:GPU:1 but available devices are [
2020-06-16 15:58:39 2859 2
原创 Windows 系统查看 CUDA 和 cuDNN 版本
一、查看 CUDA 版本方法一:通过命令执行nvcc --version得到如下结果,说明CUDA的版本是10.0方法二:去安装目录下核查,如下图所示,版本为10.0二、查看 cuDNN 版本通过进入 CUDA 的安装目录查看文件 cudnn.h 得到下图的结果,得到下图的结果,说明cudnn的版本是7.4.1。友情提示:如果是因为安装tensorflow-gpu的需要安装CUDA以及cudnn,一定要搞清楚tensorflow-gpu需要的CUDA以及cudnn的版本要求。.
2020-06-16 15:36:24 16132 6
原创 论文笔记:Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks
论文笔记:Extreme Learning Machine: A New Learning Scheme of Feedforward Neural NetworksAbstract: 前馈神经网络( feedforward neural networks)的学习速度比较慢,主要的原因可能是:1)广泛使用基于缓慢梯度的学习算法来训练神经网络。2)使用这种学习算法对网络的所有参数进行迭代调整。与传统的学习算法不同,本文针对单隐层前馈神经网络(SLFNs)提出了一种新的学习算法——极限学习机(ELM)
2020-05-17 18:32:50 1511
翻译 UMAP降维算法python包的安装和使用
一、UMAP算法的定义:统一流形近似与投影(UMAP)是一种降维技术,可以用于类似于t-SNE的可视化,也可以用于一般的非线性降维。该算法基于对数据的三个假设:1、数据均匀分布在黎曼流形上;2、黎曼度量是局部常数(或者可以近似);3、该管汇是局部连接的。根据这些假设,可以用模糊拓扑结构对流形进行建模。通过搜索具有最接近的等价模糊拓扑结构的数据的低维投影来发现嵌入。二、UMAP包的安装:...
2020-03-30 00:11:34 16960 3
原创 浅谈0-day漏洞的在野利用
浅谈0-day漏洞的在野利用一、什么是0-day漏洞0-day漏洞,又称“零日漏洞”(zero-day),是已经被发现(有可能未被公开),而官方还没有相关补丁的漏洞。通俗地讲就是,除了漏洞发现者,没有其他的人知道这个漏洞的存在,并且可以有效地加以利用,发起的攻击往往具有很大的突发性与破坏性。后来引入到黑客文化,将一些大规模、致命性、高威胁性、能够造成巨大破坏的漏洞也称为零日漏洞(并不是所有漏洞...
2020-03-29 20:00:55 9314
原创 浅谈模糊C均值聚类(Fuzzy C-means Clustering)
浅谈模糊C均值聚类(Fuzzy C-means Clustering)定义:模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM)。在众多模糊聚类算法中,模糊C-均值( FCM) 算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。假设样本集合为X={x1 ,x2 ,...
2019-04-23 14:15:19 9723
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人