在线计算lncRNA-mRNA共表达相关系数,并使用cytoscape绘制共表达网络图

长链非编码RNA(Long noncoding RNA)是一类长度大于200 nt,不编码蛋白质的RNALncRNA的功能多样,如图1所示,A:充当蛋白质和染色质的连接因子,引起染色质重构(chromatin remodeling);B:充当miRNA海绵;C:充当“scaffold”脚手架;D:与转录因子结合,引起转录激活;E:把转录因子拉走,引起转录抑制;FGH:与mRNA结合抑制翻译、调节剪切,及降解mRNA等。

                                                           图1. lncRNA功能

由于lncRNA发现较晚,功能研究不完善,因此,我们可以以mRNA为桥梁对lncRNA的功能进行推断和研究。通常将lncRNA的功能分成cis和trans两种(图2)Cis作用的原理是lncRNA的功能与其临近mRNA相关,可以以lncRNA基因组坐标上下游100 kb的mRNA作为lncRNA的靶基因进行研究。而trans作用的原理是lncRNA与其共表达的mRNA相关,可以根据表达量计算相关性以预测lncRNA的靶基因(一般要求样品数超过6个),从而研究lncRNA的功能。

                                                                图2. Cis vs trans

相关系数(correlation coefficient

相关系数用来衡量两个变量X和Y间的相关性。相关性包括:线性相关和非线性相关。

Pearson相关系数用来衡量两个变量X和Y之间的线性相关关系。常用r表示,取值范围为[-1,1]。其中负的表示负相关,正的表示正相关。值越大相关性越强。

而spearman秩相关系数用来衡量两个变量间的非线性相关关系。是一个非参数度量。常用rho(ρ)来表示。取值范围也是[-1,1]

常见的相关性标准为:不相关:0-0.1 ;低相关:0.1-0.3;中等相关:0.3-0.5;显著相关0.5-1.0。应参考具体使用场景进行判断。

虽然pearson相关系数最常用,然而它受数据分布的影响,对异常值敏感,需要数据服从近似正态分布才能使用。然而,我们遇到的数据是非常复杂的,往往并不符合线性相关,因此,越来越多的研究者使用spearman秩相关系数(Spearman’s rank correlation coefficient)计算两个变量间的相关性。注意:相关性不隐含因果关系。

在lncRNA-mRNA共表达相关系数计算中,pearson相关系数和spearman相关系数都有使用。例如在《Genome-wide analysis of lncRNAs, miRNAs, and mRNAs forming a prognostic scoring system in esophageal squamous cell carcinoma》文章中,作者写道“The correlation between prognostic lncRNA and mRNA expression profiles was analyzed by Spearman method, and the lncRNA-mRNAs pairs that the absolute value of correlation coefficients > =0.4 and p < 0.05 were selected to construct the co-expression network”,使用的是Spearman相关系数,rho阈值0.4,pvalue阈值0.05。而在《Genome-wide analysis of differentially expressed lncRNAs and mRNAs in primary gonadotrophin adenomas by RNA-seq》文章中,作者写道“The network is based on Pearson correlation coefficient (the absolute value of PCC ≥ 0.80, p-value < 0.001)”,使用的是pearson相关系数,r阈值0.8,pvalue阈值0.001

今天,我们来计算相关系数,并使用cytoscape软件绘制网络图。

1.打开相关系数计算页面

首先,使用浏览器(推荐chrome或者edge)打开lncRNA-mRNA pearson、spearman相关系数计算页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。

http://www.bioinformatics.com.cn/basic_lncrna_mrna_pearson_spearman_coexpression_analysis_t013

                                                      图3.相关系数计算页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

示例数据(仅供参考)分两部分,上半部分是lncRNA表达量,下半部分是mRNA表达量。其中行是基因,列是样品名。LncRNA和mRNA的样品名顺序必需保持一致。

                                                                  图4.输入数据

注意:需要参考示例数据,在excel中将自己的数据整理成示例数据的样式,每个cell都需要有数据,不能有空的单元格。

3,粘贴示例数据

拷贝示例数据中上半部分的lncRNA数据,粘贴到第一个输入框。拷贝示例数据中下半部分的mRNA数据,粘贴到第二个输入框。

                                                      图5. 将数据粘贴到输入框

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。并且数据矩阵中不能有空的单元格,中文字符等。

4,修改参数,并提交

我们设置了数据是否转化、相关系数算法等参数。由于示例数据来自芯片,因此这里不转化。使用pearson相关系数进行计算。

                                                                     图6. 可选参数

5,提交分析

粘贴好输入数据,调整好参数后,点击提交按钮,3秒钟后,会在页面右侧出现结果。

                                                                   图7.结果说明及下载

结果以excel存储。

                                                       8. 相关系数结果

各列说明:

LncRNA:lncRNA名字

mRNA:mRNA名字

r:pearson相关系数

pvalue:p值

flag:+:正相关,-:负相关

6. 过滤结果

下载结果后,使用excel的筛选功能进行过滤,这里以p<0.05|r|>=0.4的lncRNA-mRNA对绘制共表达网络(带header共28行)。

                                                             图9. 相关系数过滤

                                                                图10. P值过滤

7,导入cytoscape

拷贝这28行数据,粘贴到一个txt文件中。然后打开cytoscape软件,导入这个txt文件。在弹出的窗口中选择source和target。

                                                                     图11.导入txt

                                图12. 选择source和target,其中lncRNA为source,mRNA为target

                                                                    图13. 默认网络图

8. 网络图美化

经过对颜色,节点形状,线型,布局等的简单美化后,获得最终的lncRNA-mRNA共表达网络图(图12)。由于每个人的审美不同,因此这里需要花费大量的时间进行美化,有些研究者还会使用AI等软件给网络图添加背景色等进行进一步优化。

                                                        图14. 简单美化后的网络图

微生信助力高分文章,用户66000+,引用860+

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: lncRNA-miRNA-mRNA网络是涉及到长链非编码RNA、microRNA和mRNA之间相互调控的一种复杂网络结构。该网络中lncRNA可以通过与microRNA相互作用来调节mRNA的表达,从而影响细胞的生物学行为。这种网络结构在生物学研究中具有重要的意义,是唤起人们对于基因调控机制的深入研究的重要方向之一。 ### 回答2: lncRNA-miRNA-mRNA网络是基因调控中的一个重要机制,它可以在转录后水平精确地调节基因表达,并在许多生物学过程中发挥关键作用。在这个网络中,前体长非编码RNA(lncRNA)作为调节剂和中介器,通过与微小RNA(miRNA)相互作用来影响靶向基因的表达。miRNA是一类短的RNA序列,它们结合到靶向mRNA的3'未翻译区(3' UTR)上,导致mRNA的降解或抑制转录,从而影响基因表达。因此,lncRNA通过与miRNA相互作用,可以增强或抑制miRNA对目标mRNA的靶向作用,从而进一步调节基因表达。 lncRNA-miRNA-mRNA网络在许多生物学过程中发挥重要作用,包括细胞增殖、分化、转移、凋亡和移动等。lncRNA-miRNA-mRNA网络还可以在人类疾病的发病机制中发挥重要作用,包括癌症和神经系统疾病等。例如,在癌症中,lncRNA可以作为miRNA的“蚂蚁器”来调节miRNA对肿瘤抑制基因的调控作用,从而促进肿瘤的增殖和转移。因此,lncRNA-miRNA-mRNA网络已成为研究细胞生物学和疾病发生机制的重要研究方向。 总的来说,lncRNA-miRNA-mRNA网络是一种复杂的基因表达调控机制,在不同的生物学过程和疾病中扮演着重要角色,深入研究该网络的调控机制和生物学功能可以为疾病的诊断和治疗提供新的思路和策略。 ### 回答3: Lncrna-mirna-mrna网络是近年来生物学领域中的研究热点,它是由长非编码RNA(lncRNA)、微小RNA(miRNA)和信使RNA(mRNA)组成的分子网络。该网络被广泛地应用于基因表达调控、疾病诊断和治疗等方面。 在该网络中,lncRNA通过与miRNA的结合,从而抑制miRNA的作用,使miRNA无法结合到其作用靶标mRNA上进而抑制该mRNA的表达。与此同时,lncRNA还可以通过与mRNA的结合,调控mRNA的转录、剪接、聚合和转运等关键步骤,影响mRNA的表达水平和功能。因此,该网络可以实现复杂的调控机制。 近年来,越来越多的实验研究证明了该网络在多种疾病中的重要作用,如心血管疾病、癌症、神经退行性疾病等。同时,该网络也被应用于疾病的诊断和治疗方面,在疾病早期诊断和个体化治疗方面具有很大潜力。 值得注意的是,虽然这一网络已经得到了广泛的应用和研究,但是对于其机制和调控方式仍有很多未知之处,需要进一步深入的研究。另外,应用该网络在疾病诊断和治疗方面还存在许多技术和方法上的局限性,需要不断融入新的技术和探索新的方法。 总之,lncRNA-miRNA-mRNA网络是一个十分重要的分子网络,在基因调控和疾病诊断治疗方面具有广泛的应用前景。未来还需加强研究,以期在临床治疗方面发挥更大的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值