论文地址:A novel heterogeneous network-based method for drug response prediction in cancer cell lines
HNMDRP:一种新颖的基于异构网络的癌症细胞系药物反应预测方法
作者信息
[1]中国科学技术大学信息科学与技术学院
[2]中国科学技术大学生物医学工程学院
研究背景
个性化医疗面临的持久挑战在于为每位患者选择合适的药物。
基因组信息被广泛应用在细胞系与药物关联的研究中。目前,许多研究开始关注细胞系基因组改变、细胞系 - 药物敏感性和药物化学结构之间的异质关系。而有助于提高其预测性能的药物-靶标互相作用的信息还未整合到异构网络中。
该文提出了一种新颖的基于异构网络的方法,命名为HNMDRP,通过整合细胞系、药物和靶标之间的异质关系(heterogeneity relationship),准确的预测细胞系-药物关联。
研究方法
首先,构建了5个子网络:
(1)基于细胞系基因表达谱计算Pcc值获得的细胞系相似性网络
(2)基于药物化学结构计算Pcc值获得的药物相似性网络
(3)合并PPI信息和基于基因表达谱得到的相关系数获得的靶标相似性网络
(4)通过对数归一化IC50值获得的细胞系 - 药物关联网络
(5)通过已知的复合分子活性获得的药物 - 靶标相互作用网络
然后在上述子网的基础上构建一个全面的异构网络。
小tip:
Pcc(Pearson Correlation Coefficient)为皮尔森相关系数,用来反映两个变量线性相关程度的统计量。它被定义为:
其中X和Y是节点特征的列向量。
文中涉及的数据集总结:
数据集:GDSC (Genomics of Drug Sensitivity in Cancer)
该数据集由1001个癌细胞系和265个测试药物组成。这项工作使用了189种既具有化学结构特征又具有药物反应数据的药物和962种经过数据预处理后具有基因组特征和药物反应的细胞系。根据GDSC数据集提取189种药物与243种靶基因之间的相互作用。
数据集: STRING
为了将PPI纳入靶标相似性网络,从STRING数据库中总共获得4850628个PPIs数据,并提取与靶标基因相关的3040个可用基因之间的396419个