文献阅读--A systematic approach to identify novel cancer drug targets using machine learning, inhibitor

最新推荐文章于 2024-08-23 17:48:13 发布

沧海一卒

最新推荐文章于 2024-08-23 17:48:13 发布

阅读量412

点赞数

分类专栏： bioInformation It 学习文章标签：阅读机器学习数据

学习同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

9 篇文章 1 订阅

订阅专栏

最近找了一些，预测肿瘤药物靶点的文献看看，这篇我挺感兴趣。

我主要阅读了靶点预测部分，一些专业的东西还不理解，暂粗浅的记录下

用机器学习算法，找新的癌症药物靶点

中心思想：用已知的训练集学习得出一个分类器（模型），再对未知的数据集进行分类

特征
收集癌症药物靶点的基因级信息，包括：

这里写图片描述
作为机器学习的特征空间

原始数据集
1. 已知药物靶点数据集2.未知药物靶点数据集

已知药物靶点数据集：collecting anti-BrCa, -PaCa and -OvCa drugs, their targets were identified from DrugBank [31] and the Therapeutic Target Database. In total, 62 known BrCa drug targets, 69 known PaCa targets and known 45 OvCa targets constituted the positive dataset。

未知药物靶点数据集：相关蛋白，在DrugBank和Therapeutic Target Database 没有记录;没有注释为癌症相关蛋白;不与肿瘤药物靶点相互影响；没有分享Pfam功能域；与已知靶点序列相似。

用文本挖掘的方法，挖掘在肿瘤研究文献中的所研究的15663个基因，统计出5169个基因可作为未知药物靶点数据集。

机器学习和特征选择

算法：支持向量机（SVM）
目的：将要预测的数据集，分为有癌症药物靶点或无癌症药物靶点两类。

特征选择：用SVM-REF方法，对13个特征评分，根据评分，最终得到5个相关的特征，包括：Average gene essentiality，Average mRNA expression，Average DNA copy number，Mutation occurrence，Clustering coefficient。

在用最优的特征集，训练集来得出最优的预测模型。
BrCa prediction model
PaCa prediction model
OvCa prediction model

靶点预测

用生成的预测模型，对15663个人基因分类.

预测结果：1655个基因作为假定靶点,对不同的癌型有不同的预测分值，可根据分值选取后续验证的靶点。
这里写图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文献阅读--A systematic approach to identify novel cancer drug targets using machine learning, inhibitor

最近找了一些，预测肿瘤药物靶点的文献看看，这篇我挺感兴趣。我主要阅读了靶点预测部分，一些专业的东西还不理解，暂粗浅的记录下用机器学习算法，找新的癌症药物靶点中心思想：用已知的训练集学习得出一个分类器（模型），再对未知的数据集进行分类特征收集癌症药物靶点的基因级信息，包括：作为机器学习的特征空间原始数据集 1. 已知药物靶点数据集2.未知药物靶点数据集已知药物靶点数据集：collectin
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。