论文笔记：DeepEP: a deep learning framework for identifying essential proteins

最新推荐文章于 2023-06-27 22:13:01 发布

wangpan007

最新推荐文章于 2023-06-27 22:13:01 发布

阅读量495

点赞数 1

分类专栏：生信论文 python编程文章标签：深度学习蛋白质识别 Node2vec 拓扑特征样本采样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangpan007/article/details/114489936

版权

生信论文同时被 2 个专栏收录

19 篇文章 45 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

论文笔记：DeepEP: a deep learning framework for identifying essential proteins

一、论文创新
二、方法
（一）、网络结构
（二）、Node2vec得到拓扑特征
(三）、采样方法
三、数据
四、结果

一、论文创新

1.通过得到了得到了蛋白质的拓扑特征。

2.采用了一种采样方法有效的解决了重要蛋白质和不重要蛋白质的失衡问题。

二、方法

（一）、网络结构

在这里插入图片描述
提出了一种新的深度学习架构，DeeEP
1.网络有两部分组成：特征提取和分类
2.PPI网络的蛋白质拓普数据和基因表达数据作为分类模型的输入
3.通过Node2vec得到PPI网络拓扑结构特征

（二）、Node2vec得到拓扑特征

1、word2vec
在这里插入图片描述
2、Deepwalk

3、DFS邻域和BFS

4、Node2vec原理及过程
原理：

在这里插入图片描述

过程：
在这里插入图片描述

(三）、采样方法

在这里插入图片描述

M表示essential proteins的数量
N表示(non-essential proteins)，M（967）< N（3270）
采样步骤：
1、将数据集分为两个部分80%（4237）用于训练，20%用于测试（1060）
2、将负样本索引求和后打乱
3、从打乱的N个负样本中取M个负样本，并进concatenate
4、将拼接的训练进行打乱，得到本地训练的训练集
5、将训练集放入模型进行训练
6、每次训练重读2-5

设进行K次训练，非重要至少一次被选中的概率为P，训练过程中应该使得每个负样本尽可能的被选中及P足够的小：

在这里插入图片描述

三、数据

1、protein_emb.npy：由node2vec利用PPI网络生成的64维向量。它的形状是5297个蛋白质x 64个特征（见图片）
2、protein_matrix.npy：基因表达数据5297个蛋白x 3个周期x 12个时间点
在这里插入图片描述

3、protein_labels.npy：标签

四、结果

1、使用PPI网络的数据采用不同的特征生成方法
在这里插入图片描述

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
3
评论
论文笔记：DeepEP: a deep learning framework for identifying essential proteins

论文笔记：DeepEP: a deep learning framework for identifying essential proteins一、论文创新二、方法（一）、网络结构（二）、Node2vec得到拓扑特征(三）、采样方法三、数据四、结果一、论文创新1.通过得到了得到了蛋白质的拓扑特征。2.采用了一种采样方法有效的解决了重要蛋白质和不重要蛋白质的失衡问题。二、方法（一）、网络结构提出了一种新的深度学习架构，DeeEP1.网络有两部分组成：特征提取和分类2.PPI网络的蛋白质拓
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。