自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 MPNN

MPNN基本原理机制理论消息传递阶段读取阶段例子A矩阵传播模型输出模型基本原理主要由邻居聚合和消息传递构成,用Xi(k-1)表示节点i在k-1层的节点特征,ej,i表示从节点j到节点i的边特征,消息传递图神经网络可以描述为:方框表示一种可微的排列不变的函数。例如:求和,求均值,取最大值等。ϕ表示可微函数,例如MLPs(多层感知机)。机制理论MPNN的前向传播包括两个阶段,第一个阶段称为message passing(信息传递)阶段,第二个阶段称为readout(读取)阶段。定义一张图G = (

2021-03-26 17:21:30 2179

转载 图benchmark

阅读笔记-图benchmark 1、ogbn-proteins: Protein-Protein Association Network2、ogbl-ddi: Drug-Drug Interaction Network3、ogbl-biokg: Biomedical Know...

2021-03-17 15:39:23 876

原创 DeepAtom: A Framework for Protein-Ligand Binding Affinity Prediction

深度可分离卷积DwConv作为深度可分离卷积,虽然它不能结合不同的输入通道,但两个相邻的正则点卷积可以有效地融合通道上的信息。另一个分支在与第一个分支的输出连接之前一直保持ptas身份。这种身份分支可以看作是一种有效的特征重用设计,增强了特征的传播,减少了参数的数量。在一个基本单元内,纵深卷积和点向卷积分别引入了·T·R·n2和·n2·n2参数。因此,用一个基本单位可以来代替标准卷积。DeepAtom使用 3个3深度卷积,通道数设置为244,488,976。因此,通过高效的模型设计,我们可以很容易地获得.

2021-03-11 21:28:39 455

原创 Masked Language Modeling for Proteins via LinearlyScalable Long-Context Transformers

摘要transformer模型已在各种领域中取得了最先进的结果。 但是,对训练注意力机制以学习远程输入之间的复杂依存关系的成本的担忧不断增加。利用学习的注意力矩阵的结构和稀疏性的解决方案出现了。 但是,涉及长序列的实际应用(例如生物序列分析)可能无法满足这些假设,从而无法探索这些模型。 为了解决这一挑战,我们提出了一种基于快速随机正交特征(FAVOR)的新型Transformer架构,Performer。 我们的机制在token中的token数量上线性缩放,而不是平方缩放,其特征在于亚二次空间复杂度,并且

2021-03-07 20:43:58 363

原创 RDKit中的分子3D构象生成

RDKit中的分子3D构象生成一、构象生成算法概述1.基于距离2.基于知识二、代码实现1.添加氢原子2.距离几何算法生成3D结构3.距离几何+ETKDG生成3D构象一、构象生成算法概述1.基于距离生成分子的连接边界矩阵对边界矩阵进行平滑处理根据边界矩阵,随机产生一个距离矩阵。把产生的距离矩阵映射到三维空间中,并为每个原子计算坐标。对计算的坐标结果使用力场和边界矩阵进行粗略的优化。2.基于知识代码实现>>> from rdkit import Chem>&gt

2021-02-17 09:46:50 1183 2

原创 TensorFlow的内置加入集合函数

tf.add_to_collection(‘list_name’, element)此函数将元素添加到列表中参数:name:列表名。如果不存在,创建一个新的列表element:元素输出结果:debug描述:

2021-02-12 22:38:01 113

原创 Beyond Low-frequency Information in Graph Convolutional Networks

文章目录概述一、如何在GNNs中使用不同频率的信号,同时使GNNs适用于不同类型的网络?二、聚合方式三、模型整体结构总结概述图神经网络已被证明在各种与网络相关的任务中都是有效的。 现有的大多数GNN通常利用节点特征的低频信号,这引起了一个基本问题:在现实应用中,我们只需要低频信息吗? 在本文中,我们首先进行了一项评估低频和高频信号作用的实验研究,结果清楚地表明,仅探索低频信号与在不同情况下学习有效的节点表示相距甚远。 我们如何能够自适应地学习GNN中低频信息以外的更多信息? 好的答案可以帮助GNN增强

2021-01-31 10:10:00 1085

原创 Molecular Interaction Transformer for DrugTarget Interaction Prediction

哒哒哒哒哒哒多多多多多多多多多多多多多多多多呃呃呃呃呃呃呃呃呃鹅鹅鹅鹅鹅鹅饿鹅鹅鹅饿1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111

2021-01-30 09:08:37 797 1

原创 transformer-xl

transform有长程依赖关系,受到语言建模上下文长度的固定的限制提出transformer-xl 超越固定长度

2021-01-25 13:39:19 172

原创 HMM模型

1. 隐马尔可夫模型的结构信息隐马尔可夫模型中的变量可以分为两组,第一组是状态变量{y1,y2,…,yn},,其中yi∈y表示第i时刻的系统状态,通常假定状态变量是隐藏的、不可被观测的,因此状态变量也被称为隐变量。第二组是观测变量{x1,x2,…,xn},其中xi∈x 表示第i时刻的观测值,如下图所示:模型的图结构看起来有点类似于我们熟知的RNN模型。图中的箭头表示变量之间的依赖关系。在任意时刻,观测变量的取值仅依赖于状态变量,与其他状态变量和观测变量的取值无关。同时,t时刻的状态仅依赖于t−1时刻的

2020-12-08 11:14:25 126

原创 t检验和u检验的差别

t检验的分类:t检验的应用条件:(1)方差未知并且样本量比较小(2)样本来自于正态总体分布,两样本均数比较要求总体方差相等(3)独立性

2020-12-07 16:29:31 3651

原创 metapah2vec

metapah2vec:基于meta path的随机游走1.1异构图的定义新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入)1.1异构图的定义T为结点的类型新的改变我们对Markdown编辑器进行了一些功能拓展

2020-12-02 23:09:05 455

原创 PAT 旧件盘

**1029 旧键盘 (20分)**旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及实际被输入的文字,请你列出肯定坏掉的那些键。输入格式:输入在 2 行中分别给出应该输入的文字、以及实际被输入的文字。每段文字是不超过 80 个字符的串,由字母 A-Z(包括大、小写)、数字 0-9、以及下划线 _(代表空格)组成。题目保证 2 个字符串均非空。输出格式:按照发现顺序,在一行中输出坏掉的键。其中英文字母只输出大写,每个坏键只输出一次。题目保证至少有

2020-10-23 10:54:28 123

原创 PAT乙级 1025 反转链表 (25 分)

#1025 反转链表 (25 分)'''00100 6 400000 4 9999900100 1 1230968237 6 -133218 3 0000099999 5 6823712309 2 33218'''link=[None for _ in range(10000)]head,N,K=map(int,input().split(' '))for i in range(N): add,data,next=map(int,input().split(' ')) .

2020-10-23 10:25:14 212

原创 nlp对语言进行可解释化

用nlp高效解析语言文字tf-idf相关语言模型神经网络语言模型bert的结构masked lmTransformertf-idf用来支持文本表征的抽取和预测,比如one-hot将各个词变成一个向量,喜欢(001)、不喜欢(010)、很喜欢(011)等,使用这些向量来作为预测和训练的语料,运算结束后再解码为具体的词句,由于特征的维度特别高,tf-idf基于词频来统计文本表征的算法可以表示为tfij=nij/∑1≤k≤j≤nnkj tf_{ij}=n_{ij}/\sum_{\mathclap{1\l

2020-09-22 10:52:17 325

原创 关于注意力机制的理解

有种做英语阅读理解的感觉

2020-07-12 12:33:10 166

原创 pytorch基础知识之torch.nn

导入minist数据集,使用request下载数据集from pathlib import Pathimport requestsDATA_PATH = Path("data")PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "http://deeplearning.net/data/mnist/"FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).

2020-07-11 17:19:44 427

原创 机器学习2 模型评估选择

真实情况 预测情况正例 反例正例 TP(预测为正例,正确) FN(预测为反例,错误)反例 FP(预测为正例,错误) TN(预测为反例,正确)真正例率等于在真实情况为正例的时候,预测为正例/总的正例数真反例率等于在真实情况为反例的时候,预测为反例/总的反例数查准率等于预测情况为正例的数量/总样本数量...

2020-06-02 21:44:23 131

原创 计算机网络体系概括

广泛广泛

2020-04-12 14:15:46 156

原创 东华进阶68 最长的单词

问题描述;明明刚开始学习英语的时候,对英语有浓厚的兴趣,但是随着时间的推移,英语单词量的增加,明明越来越觉得背单词是一件相当痛苦的事情。于是他想出各种各样的方法来增加背单词的乐趣。这次他想出的方法是把所有要背的英语单词排成一行,找出其中最长的一个单词来先背,然后划去这个单词,在剩下的单词中再找出一个最长的单词来背,以此类推,直到把所有单词都背完。如果有多个长度相同的单词,则先背一行中靠前的那个...

2020-04-12 10:23:00 120

原创 用python来读取csv文件

1 读取李白将进酒代码示例:with open("jiangjinjiu.txt","w",encoding="utf-8") as f: f.write("君不见,黄河之水天上来,奔流到海不复回。君不见,高堂明镜悲白发,朝如青丝暮成雪。") 试验效果:还需解码成utf-8格式才可显示文字的读入。...

2020-04-07 22:26:07 100

原创 东华大学进阶28 最大与最小

东华大学进阶28 最大与最小作者: ZhouMingLiang 时间限制: 10S章节: 一维数组问题描述 :明明喜欢玩游戏,而明明的爸爸也乐意陪明明玩各种各样的小游戏。但是在游戏中,明明的爸爸又十分注意培养明明的智力,他希望通过游戏,不仅让明明得到快乐,而且又能让明明学到一些知识,锻炼他的思维能力,为将来的发展打下基础。一天,明明的爸爸和明明做起了一个叫“最大与最小”的游戏,游戏的规则简单...

2020-04-06 15:26:50 199 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除