基因表达模式聚类以及可视化

最近在使用RNA_seq数据做些分析,结果得到了大量差异表达以及共表达的基因,如何合理展示这些基因也是一件不简单的事情。除了常见的热图(heatmap)展现形式,今天在推荐另外一种展示方式(下图C)。

这里写图片描述

需要R包TCseq或者Mfuzz。我这里给出的代码是基于TCseq。
输入文件就是一个基因表达量的矩阵,如下图。
这里写图片描述

代码也很简单,见下图,也请点击阅读原文查看代码。

library(TCseq)
svg(filename="/stress_analysis/drought_and_heat/heat.svg",width=3.5,height=15)
data <- read<
  • 12
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
ggplot是一个数据可视化包,可以用于创建各种图形,包括热图。在基因表达研究中,热图可以用于展示基因在不同样本或条件下的表达水平。 首先,我们需要准备基因表达数据和相应的样本信息。基因表达数据是一个包含基因名称和表达水平的矩阵,每行代表一个基因,每列代表一个样本。样本信息是一个包含样本名称、条件或类别等信息的数据框。 接下来,使用ggplot进行热图的绘制。首先,我们需要用到ggplot的geom_tile函数,该函数可以创建矩形图块用于展示每个基因在每个样本中的表达水平。通过设置颜色映射,可以将高表达和低表达基因区分开来。我们还可以添加颜色条以表示表达水平的范围。 为了更好地理解基因表达数据的模式,我们可以对基因和样本进行聚类。在ggplot中,我们可以使用row_cluster和column_cluster参数来控制基因和样本的聚类。通过将相似的基因和样本放在一起,我们可以更好地观察它们之间的相似性和差异性。 另外,我们还可以添加行和列的注释信息。例如,可以根据基因的功能或特征对基因进行分组,并在热图的边缘添加注释。这样可以帮助更好地理解基因的生物学意义。 最后,通过调整坐标轴标签、图例和标题等参数,我们可以进一步美化和定制热图的外观。这样我们就可以更直观地观察基因在不同样本或条件下的表达模式,发现隐藏在数据中的模式和趋势。 总而言之,使用ggplot进行基因表达热图的绘制可以帮助我们更好地展示和理解基因在不同样本或条件下的表达水平,并揭示基因之间的相似性和差异性。它是基因表达研究中常用的数据可视化方法之一。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值