参考https://academic.oup.com/bioinformatics/article/31/11/1805/2364959#84759599
基于随机游走的潜在疾病相关microRNAs预测
miRNAs associated with d iseases p rediction MIDP
识别与疾病相关的
microRNAs (disease miRNAs)
有助于探索疾病的
发病机制
。由于
miRNA
通过其靶基因的调控来完成功能,且目前实验验证的靶点数量不足,现有的一些方法已经根据预测的靶点推断出潜在的疾病
miRNA
。由于目标预测结果的假阳性率和假阴性率较高,这些方法难以取得良好的预测效果。
另外,有几种方法根据相关疾病构建了由
miRNA
组成的网络,并利用网络中的信息来预测疾病的
miRNA
。但是,这些方法没有考虑到网络节点的先验信息和不同类别节点各自的局部拓扑结构。因此,开发一种利用更有用的信息来预测可靠的疾病
miRNA
候选体的方法是非常必要的。
•
功能相似的
miRNA
通常与相似的疾病相关,反之亦然。因此,根据相关疾病计算一对
miRNA
之间的功能相似性,构建
miRNA
网络。提出了一种基于网络随机游走的预测方法。对于已知相关
miRNA
的疾病,将网络节点分为标记节点和未标记节点,并建立这两类节点的转移矩阵。
•
此外,不同类别的节点具有不同的转移权值。这样就可以充分利用节点的先验信息。同时,对不同类别节点周围的各种拓扑范围进行了集成。此外,行走者离开标记节点的距离是通过重新启动行走来控制的。这有助于减轻噪声数据的负面影响。对于没有任何已知相关
miRNA
的疾病,我们扩展了
miRNA-disease
双分子层网络。
•
在预测过程中,利用
疾病之间的相似性
、
miRNA
之间的相似性
、
已知的
miRNA-
疾病关联
以及
双层网络的拓扑信息
。此外,还考虑了来自不同网络层的信息的重要性。该方法对
18
种人体疾病的
AUC
值在
0.786 ~ 0.945
之间,取得了较好的效果。此外,乳腺肿瘤、肺肿瘤、前列腺肿瘤和
32
种疾病的病例研究进一步证实了我们方法发现潜在疾病
miRNA
的能力。
•
2.1 Process of predicting disease miRNAs
•
2.2 Construction of Mnet
•
2.3 Two one-step transition matrices
•
2.4 Establishing MIDP prediction model
•
2.5 Prediction based on the bilayer network
•
2.5.1 Construction of bilayer network and its association matrix
•
2.5.2 Establishing MIDPE prediction model
•
MicroRNAs (miRNAs) are small non-coding RNAs that play important roles in gene regulation by targeting mRNAs for cleavage or translational repression (
Bartel
, 2004 ; Chatterjee and
Grobhans
, 2009 ). Recently, accumulating evidence has indicated that miRNA dysregulation is closely related to the development, progression and prognosis of various human diseases (Alvarez-Garcia
et al.
, 2005;
Lynam
-Lennon
et al.
, 2009 ;
Meola
et al.
, 2009 ). Therefore, identifying the miRNAs associated with diseases (disease miRNAs) contributes to the exploration of the pathogenesis of diseases.
•
MicroRNAs (miRNAs)
是一种非编码小
RNA
,通过靶向
miRNA
进行切割或翻译抑制而在基因调控中发挥重要作用
(
Bartel
, 2004;Chatterjee
和
Grobhans
, 2009)
。近年来,越来越多的证据表明
miRNA
的失调与多种人类疾病的发生、发展和预后密切相关
(Alvarez-Garcia
等,
2005;Lynam-Lennon
等,
2009;Meola
等人,
2009)
。因此,识别与疾病相关的
miRNA (disease miRNAs)
有助于探索疾病的发病机制。
•
近年来,计算预测方法已被用于获得可靠的疾病
miRNA
候选体,用于进一步的实验研究。由于
miRNA
是通过调控靶
mRNA(target genes)
的表达来实现其功能的,因此人们提出了几种基于靶点的方法。
•
Jiang
等
(2010a)
通过测量其相关靶基因的相似性来估计
miRNA
之间的相似性。基于靶标的
miRNA
网络与疾病表型网络相结合,推断
miRNA
与疾病的相关分数。此外,他们通过进一步整合
miRNA
的相似性与疾病表型的相似性,改进了分数的计算
(Jiang et al.
,
2010b)
。
Li
等
(2011)
也收集了
miRNA
靶基因,并测量了靶基因与疾病相关基因之间的功能一致性评分
(FCS)
。然而,在计算
FCS
时,该方法忽略了由靶标和疾病基因组成的拓扑结构。此外,由于目前已被生物实验验证的靶标数量不足,
Jiang
和
Li
均采用靶标预测程序如
TargetScan
(Lewis et al.
,
2003)
和
PITA(
Kertesz
et al.
,
2007)
获得了靶标基因。因为这些项目有很高的假阳性和假阴性率
(Bartel.,2009;Liu et al.
,
2014;
基于目标的预测方法很难达到较高的预测性能。
Shi
等人
(2013)
利用蛋白相互作用网络中
miRNA
靶点与疾病基因之间的功能联系来识别
miRNA
相关性。该方法还受到目标预测精度低的影响。此外,它忽略了基因之间的功能相似性。
•
众所周知,功能相似的
miRNA
通常与相似的疾病相关,反之亦然
(Bandyopadhyay et al.
,
2010;Goh
等,
2007;Lu
等人,
2008)
。
•
Chen
的方法
(Chen and Zhang, 2013)
侧重于疾病之间的表型相似性以及
miRNA
与疾病之间的关联。对于一个具体的
miRNA mi
,与已知的
mi
相关疾病相似的新疾病被作为
mi
相关候选。由于没有考虑到
miRNA
之间的相似性,因此该方法无法获得优异的性能。由于功能相关的
miRNA
往往与相似的疾病相关联,因此我们成功地基于相关疾病的语义相似性来估计两个
miRNA
的功能相似性
(Wang et al.
,
2010)
。
•
HDMP
整合了与
miRNA
特征的功能相似性来预测与特定疾病相关的候选基因
(Xuan et al.
,
2013)
。它只考虑了候选对象的
k
个最相似的邻居,而忽略了这些邻居所形成的拓扑结构。为了构建由
miRNA
相关疾病衍生的
miRNA
网络,我们使用任意两个
miRNA
之间的功能相似性作为连接它们的边的权重。
•
RLSMDA
(Chen and Yan.
,
2014)
通过整合已知的
miRNA-disease
关联性、疾病与
miRNA
网络的相似性,开发了基于正则化最小二乘法的预测方法,以发现特定疾病潜在的
miRNA
候选体。
RLSMDA
不仅对有部分相关
miRNA
的疾病有很好的预测效果,对无相关
miRNA
的疾病也有很好的预测效果。不幸的是,它忽略了
miRNA
网络的拓扑信息
。
•
RWRMDA
(Chen et al.
,
2012)
通过
miRNA
网络的随机游走,获得了与已知疾病
miRNA
功能相似的推定疾病
miRNA
。然而,网络由两类节点组成。对于一种特定的疾病,一些淋巴结被生物学实验证实与疾病有关,但是其他的淋巴结没有证据证实它们与疾病的关系。遗憾的是,没有考虑这两类节点及其各自的局部拓扑结构的先验信息。
•
因此,我们提出了一种新的
基于随机游走
的预测方法,该方法利用了节点的特性和不同的拓扑范围。此外,我们扩展了
miRNA-disease
双分子层网络的步行距离,以预测没有任何已知相关
miRNA
的候选疾病。