自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 R语言过滤极端异常值

在做归一化时,往往需要过滤掉异常值,来消除异常值对归一化的影响,接下来我们看看异常值的定义,以及如何处理异常值。(quartile)是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。四分位数也被称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括 25%的数据,处在各分位点的数值就是四分位数。四分位数有三个,第一个四分位数是下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用 Q1、Q2、Q3表示:是Q3-Q1,也就是说上下四分位数的差值。

2023-05-30 16:08:23 575

原创 corrplot包绘制相关性图(R语言)

corrplot包可以简单快速的绘制出好看的相关性图,图案类型多种多样,而且可以上下部分分别绘制。本篇文章介绍了corrplot包的使用,总结了corrplot函数的参数说明。

2023-05-30 15:48:45 2985 1

原创 归一化的解释说明及怎么做(附R语言代码)

为什么要做归一化?在生物学实验中,往往会因为上样量等差别,导致本来实际样本中相似的定量值的结果因为实验原因导致有整个样本的整体偏差。因此,归一化的目的是把实验导致的整体偏差校正回来。各种归一化的方法解释及R语言怎么做归一化方法有很多,主要包括:中值归一化、共有蛋白中值归一化、线性函数归一化、Z Score 归一化等。

2022-10-20 13:09:27 4237 1

原创 R语言绘制不等宽柱形图

R 中的 ggplot2 包提供了绘制矩形的函数:geom_rect()。geom_rect()函数可以根据xmin, xmax,ymin, ymax四个点的坐标绘制四边形,这就为我们绘制不等宽柱形图提供了函数基础。​。

2022-09-27 09:54:47 1108

原创 R语言如何做NMDS分析

​ 人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。​ 非度量多维标度(NMDS)分析,是PCoA的非度量替代方法。NMDS是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。

2022-09-26 14:42:17 5630 2

原创 R语言如何绘制基础图形:柱状图、折线图、面积图(33)

1.什么是柱状图、折线图、面积图?柱形图:用于显示一段时间内的数据变化或显示各项之间的比较情况。在柱形图中,类别型或序数型变量映射到横轴的位置,数值型变量映射到矩形的高度。折线图:用于在连续间隔或时间跨度上显示定量数值,最常用来显示趋势和关系(与其他折线组合起来)。此外,折线图也能给出某时间段内的整体概览,看看数据在这段时间内的发展情况。面积图:是在折线图的基础之上形成的,它将折线图中的折线与自变量坐标轴之间的区域使用颜色或者纹理填充(填充区域称为“面积”),这样可以更好地突出趋势信息,同时让图表

2022-08-24 13:32:36 3843 1

原创 R语言如何绘制雷达图(32)

1.什么是雷达图?​ 雷达图是以从同一点开始的轴上表示的三个或更多个变量的二维图表的形式显示多变量数据的图形方法。轴的相对位置和角度通常是无信息的。 雷达图也称为网络图,蜘蛛图,星图,蜘蛛网图,不规则多边形,极坐标图或Kiviat图。它相当于平行坐标图,轴径向排列。​ 雷达图和折线图是是很相似的,只不过坐标轴由直线坐标轴,变成了极坐标轴。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoDat

2022-07-29 09:41:31 2318

原创 R语言如何绘制丰度排序散点图(31)

1.什么是丰度排序散点图?​ 蛋白定量值特征分析可以通过绘制累积曲线或丰度排序散点图查看。​ 之前我们介绍了对蛋白定量值从高到低排序后计算累积值,并绘制累积分布图,用于展示每种蛋白质对样本总定量值的贡献,可以较为显著的观察到定量值占比比较高的蛋白数。​ 那么什么是丰度排序散点图呢?对蛋白定量值从高到低进行排序后画图。可以用来展示鉴定蛋白总数,定量检测数量级范围,以及定量值密集分布程度。​ 本文我们就来讨论一下丰度排序散点图是如何绘制的以及如何对其进行解读。2.绘图前的数据准备demo数

2022-07-26 09:27:55 882

原创 R语言如何绘制PCoA主坐标分析(30)

1.什么是PCoA?​ 人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。​ PCoA(principal co-ordinates analysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要排在前几位的特征值,PCoA 可以找到距离矩阵中最主要的坐标,结果是数据矩阵的

2022-07-20 09:58:26 4300 2

原创 R语言如何绘制散点密度图(29)

散点密度图是在散点图的基础上,计算了每个散点周围分布了多少其他的点,并通过颜色表现出来。当数据很多的时候,散点图上的点就会存在很多重叠,这时候比较难以看出其分布特征,需要一个辅助的指标来了解密集程度,通常用颜色图例来标识密集程度。​ 本文我们就来讨论一下散点密度图是如何绘制的以及如何对其进行解读。demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/scatterDensity/demo.txt下载。数据包含2列,需要有列名。第一列

2022-06-28 17:21:28 1918

原创 R语言如何绘制桑葚图(28)

1.什么是桑葚图?桑基图(Sankey Diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小。桑基图主要由边、流量和节点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。本文我们就来讨论一下桑葚图是如何绘制的。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoDa

2022-06-20 12:46:16 4177

原创 R语言如何绘制相互作用网络图(27)

1.什么是相互作用网络图?生物网络是复杂网络,也是以系统科学的思想研究生命科学的桥梁。网络中的节点可以是蛋白质,基因,RNA或DNA等,网络的边对应节点之间的物理、生化或功能上的相互作用。生物分子之间的相互作用并不是一成不变的,反应在基因调控网络上,则节点之间的边会因时间、空间或外部环境的变化而发生变化。网络比较和分析是生物网络的研究重点。网络中生物分子及其相互作用的显著变化,形成差异性网络,这种差异性变化对细胞信号传导、细胞发育、环境压力、药物治疗以及疾病状态的转变具有重大的参考价值。网络图主要由边和

2022-06-20 12:45:56 2138 2

原创 R语言如何绘制变异系数曲线(24)

变异系数曲线1.什么是变异系数曲线?变异系数(Coefficient of Variation):当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行

2022-05-31 13:26:04 1526

原创 R语言如何绘制弦图(25)

1.什么是弦图?弦图(chord diagram)又称和弦图。可以显示不同实体之间的相互关系和彼此共享的一些共通之处,因此这种图表非常适合用来比较数据集或不同数据组之间的相似性。节点围绕着圆周分布,点与点之间以弧线或贝塞尔曲线彼此连接以显示其中关系,然后给每个连接分配数值(通过每个圆弧的大小比例表示)。此外,也可以用颜色将数据分成不同类别,有助于进行比较和区分。弦图的特点在于,它有助于我们看出数据之间的关系,适用于比较数据集或不同数据组之间的相似性。连接两个数据点的弧线可以以颜色、弧线与圆的接触面积大小

2022-05-30 09:48:59 4122

原创 R语言如何绘制累积曲线(23)

1.什么是累积曲线?累积曲线,全称是“经验累积分布函数”(ecdf)在X轴映射所有数值,在Y轴映射排名的累积占比。最后通过点图和梯度连接线来进行可视化数据。就出现了简单的经验累积分布函数(ecdf)为了理解这个抽象的概念,我们用学生成绩表的累积曲线举个例子。学生的语文成绩如下:第一列是学生名称,第二列是语文成绩。绘图时,数据会按照从小到大排序并计数,根据所占总数的比例,不断累积,最终如下图的蓝色所示。从图中可以看出(红线),有50%的学生语文成绩在60分以下。2.绘图前的数据准备​ d

2022-05-27 09:40:37 3595

原创 R语言如何绘制棒棒糖图(22)

1.什么是棒棒糖图?棒棒糖图,顾名思义,由点棍组成,形似棒棒糖。棒棒糖图(lollipop chart):棒棒糖图传达了与柱形图或者条形图相同的信息,只是将矩形转变成线条,这样可减少展示空间,重点放在数据点上,从而看起来更加简洁、美观。相对柱形图与条形图,棒棒糖图更加适合数据量比较多的情况。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/lolly/demoData.txt下载。​ 包含2个维

2022-05-26 09:17:40 1357

原创 R语言如何做FDR校正(21)

1.什么是FDR校正?FDR (false discovery rate),即校正后的P值,中文一般译作错误发现率。在转录组分析中,主要用在差异表达基因的分析中,控制最终分析结果中,假阳性结果的比例。为什么要用FDR?在转录组分析中,如何确定某个转录本在不同的样品中表达量是否有差异是分析的核心内容之一。一般来说,我们认为,不同样品中,表达量差异在两倍以上的转录本,是具有表达差异的转录本。为了判断两个样品之间的表达量差异究竟是由于各种误差导致的还是本质差异,我们需要根据所有基因在这两个样本中的表达量数据

2022-05-24 09:21:18 10959 1

原创 R语言如何绘制云雨图(20)

1.什么是云雨图?云雨图,顾名思义,由2部分组成,上方的半个小提琴图形似云朵,下方的点图形似雨滴。上方的半个小提琴图,类似于核密度曲线,其曲线下的面积是1。下方的点图,其实是频率分布直方图的点状抽象。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/rainCloud/demo.txt下载。​ 包含2个维度的数据,通常每一列是个样本,每一行是个基因3. R语言怎么画云雨图# 加载R包,没

2022-05-23 10:00:03 1973

原创 R语言如何做时间序列分析(19)

1.什么是时间序列分析?在研究基因表达谱或者蛋白表达谱时,经常会涉及到对时间序列的分析。例如,不同的基因或蛋白表达水平随时间表现出怎样的动力学特征,怎样挖掘潜在的时间特征?本篇让我们来看一个能够分析基因表达谱或者蛋白表达谱的时间动力学特征的R包-Mfuzz。它能够识别表达谱的潜在时间序列模式,并将相似模式的基因聚类,以帮助我们了解基因的动态模式和它们功能的联系对于微阵列数据的分析,经常使用聚类技术。大多数此类方法都基于数据的硬聚类,其中一个基因(或样本)被分配到一个聚类中。然而,硬聚类存在一些缺点,例

2022-05-20 09:35:32 1628

原创 R语言如何绘制多边形树状图(18)

1.什么是多边形树状图?多边形树状图,它是一种利用嵌套式多边形显示层次结构的方法,同时通过面积大小显示每个类别的数量大小。多边形树状图采用多边形表示层次结构里的节点,父子节点之间的层次关系用多边形之间的相互嵌套隐喻来表达。每个类别会被分配一个多边形区域,而其子类别则由嵌套在其中的小多边形代表。当不同类别分配不同数量时,这些多边形的面积大小会与数量成正比显示。此外,主类别的面积大小是其所有子类别的总和。如果没有数量分配给子类别,那么其面积则是主类别的总面积除以子类别的数目。因此多边形树状图是一种紧凑而且

2022-05-19 09:21:56 915 5

原创 R语言如何绘制词云图(17)

1.什么是词云图?“词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用。戈登做过编辑、记者,曾担任迈阿密先驱报新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的“关键词”进行视觉上的突出。词云图过滤掉大量的文本信息,使浏览者只要一眼扫

2022-05-18 09:56:03 4195

原创 R语言如何绘制簇状、堆积、填充柱形图(16)

1.什么是簇状、堆积、填充柱形图?如图所示,它们分别是簇状柱形图、堆积柱形图、填充比例柱形图。顾名思义,簇状柱形图,每组的数据,每个单独成柱,但是都簇集到一块儿;堆积柱形图,是每组的数据都堆叠在同一个柱子上;填充比例柱形图,是在堆积柱形图的基础上,按照比例分布的。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/bar/demo.txt下载。包含2个维度的数据。每一行是一簇柱子,每一列用不同的颜色

2022-05-17 09:50:35 8434

原创 R语言如何绘制饼图/甜甜圈图(15)

1.什么是饼图/甜甜圈图?在工作中如果遇到需要计算总费用或金额的各个部分构成比例的情况,一般都是通过各个部分与总额相除来计算,而且这种比例表示方法单看数字很抽象,我们可以使用一种饼形图表,能够直接以图形的方式直接显示各个组成部分所占比例,更加形象直观。饼图,是指使用圆形及圆内扇形的面积来表示数值大小的图形,其一般用于表示总体中各部分所占的比例。甜甜圈图(圆环图),其本质是将饼图的中间区域挖空。虽然如此,甜甜圈图还是有其优点的。饼图的整体性太强,会让我们将注意力集中在比较饼图内各个扇形之间占整体比重的关

2022-05-16 09:58:36 4699

原创 R语言如何绘制相关性热图(14)

1.什么是相关性热图?相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。当两个变量之间存在非常强烈的相互依赖关系的时候,我们就可以说两个变量之间存在高度相关性。若两组的值一起增大,我们称之为正相关,若一组的值增大时,另一组的值减小,我们称之为负相关。默认一般使用皮尔逊算法算相关性。皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于-1与1之间。计算完相关性后,我们通过热图做可视化。热图(

2022-05-14 07:42:43 9013

原创 R语言如何绘制相关性矩阵(13)

1.什么是相关性矩阵?相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。当两个变量之间存在非常强烈的相互依赖关系的时候,我们就可以说两个变量之间存在高度相关性。若两组的值一起增大,我们称之为正相关,若一组的值增大时,另一组的值减小,我们称之为负相关。默认一般使用皮尔逊算法算相关性。皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于-1与1之间。计算完相关性后,我们通过相关性矩阵做可视化。

2022-05-13 10:25:53 5909

原创 R语言如何绘制双向柱形图(12)

1.什么是双向柱形图?双向柱状图(又名正负条形图),使用正向和反向的柱子显示类别之间的数值比较。其中分类轴表示需要对比的分类维度,连续轴代表相应的数值。其实就是由两个不同数据系列的柱形图组成的。在组学数据分析中,双向柱形图,可以很直观的看到,上下调蛋白,注释到该通路下的数量。当然双向柱形图的作用不止如此,下面让我们一起来看看双向柱形图该怎么画吧。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/model/ggp

2022-05-12 13:07:18 5549 1

原创 R语言如何绘制核密度图(11)

1.什么是核密度图?核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。核密度曲线类似于概率密度曲线,其曲线下的面积是1,因此其y轴上的单位通常是小于1的核密度分布值。对这个核密度曲线求积分的结果为1,也就是其曲线下的面积为1。实质是一种对直方图的抽象。假设我们有n个数X1-Xn,我们要计算某一个数X的概率密度有多大。核密度估计的方法是这样的:其中

2022-05-11 09:36:43 5613

原创 R语言如何绘制小提琴图(10)

1.什么是小提琴图?小提琴图是箱线图的变种,展示了任意位置的密度,通过小提琴图可以知道哪些位置的密度较高。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。本文我们就来讨论一下小提琴图是如何绘制的以及如何对其进行解读。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/BoxPlot/boxplot.txt下载。​ 包含2个维度的数据,通常每一列是个样本,每一行

2022-05-11 09:36:20 4047

原创 R语言如何绘制ROC曲线(9)

1.什么是ROC曲线?ROC曲线反映敏感性和特异性连续变量的综合指标,用于二分类。**AUC:**根据曲线位置,把整个图划分成了两部分,曲线下方部分的面积被称为 AUC(Area Under Curve),用来表示预测准确性,AUC 值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角,预测准确率越高。临界点cut off point:ROC曲线最靠近左上方那个点的临界值为最佳临界值。本文我们就来讨论一下ROC曲线是如何绘制的以及如何对其进行解读。2.绘图前的数据准备​ demo

2022-05-10 16:39:15 5662 3

原创 R语言如何绘制Upset图(8)

1.什么是Upset图?对于集合的可视化,第一时间想到的都是韦恩图(venn diagram),一般集合不超过5个的时候,可视化效果还是不错的。但是一旦数据集增加,比如说五个的时候,你就很难从图中解读出想要的信息了。即便你把它画的很美观,但还是很难直观找到自己需要的信息。可视化的目的不是炫技,而是快速理解数据。而且韦恩图最大只支持7个数据集合。于是这时候就能体会出upset图的优势了。2.绘图前的数据准备​ demo数据可以在https://www.bioladder.cn/shiny/zyp/bi

2022-05-10 09:35:16 2631 4

原创 R语言如何绘制三维PCA图(7)

1.什么是三维PCA?​ 人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。​ 主成分分析法,也被称为主分量分析法,是很常用的一种数据降维方法。主成分分析法采用一个线性变换将数据变换到一个新的坐标系统,使得任何数据点投影到第一个坐标(第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,在第三个坐标(第三主

2022-05-09 15:34:58 2920

原创 科研必备网站(收藏夹吃灰系列)

分享一些科研必备的网站,也供自己找不到网址时检索。V2022年3月16日1. 在线绘图网站BioLadder-生物信息在线分析可视化云平台(https://www.bioladder.cn/)MetaboAnalyst-代谢组学数据分析(https://www.metaboanalyst.ca/MetaboAnalyst/ModuleView.xhtml)Plotly-一些动态交互图(https://chart-studio.plotly.com/feed/#/)易词云-词云图在线绘制(htt

2022-03-16 11:23:41 2317

原创 R语言如何绘制韦恩图(6)

如何绘制韦恩图​ 大家好!我是BioLadder生物信息在线可视化云平台的工程师小宇,从今天起我会不定期的在公众号分享云平台各个模块的使用方法及案例,来帮助大家更快熟练的使用云平台。希望大家多多关注,更希望可以听到您的反馈!小宇先谢谢大家喽!1.什么是韦恩图?​ 维恩图用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。 一般个数在2到7组之间。2.绘图前的数据准备​

2022-03-02 10:00:20 5061 2

原创 R语言如何绘制箱线图(5)

R语言如何绘制箱线图(5)1.什么是箱线图?箱线图又称盒图,是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须(whisker)”。由于现实数据中总是存在各式各样地“脏数据”,也称为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,将这些

2022-03-01 16:08:13 10325 2

原创 R语言如何绘制PCA图(四)

1.什么是PCA?人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。主成分分析法,也被称为主分量分析法,是很常用的一种数据降维方法。主成分分析法采用一个线性变换将数据变换到一个新的坐标系统,使得任何数据点投影到第一个坐标(第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,以此类推。因此,主成分分析可以减

2021-12-30 16:04:45 8357 5

原创 R语言绘图(二)富集气泡图

1.什么是富集气泡图?气泡图是一种多变量图表,是散点图的变体。气泡图最基本的用法是使用四个值来确定每个数据序列,和散点图一样,气泡图将两个维度的数据值分别映射到坐标轴上,其中 X 轴和 Y 轴分别代表不同的两个维度的数据,但是不同于散点图的是,每个气泡的面积代表第三个维度的数据,每个气泡的颜色代表第四个维度的数据。气泡图通过气泡的位置,面积大小和颜色等,可分析数据之间的相关性。需要注意的是,圆圈状气泡的大小是映射到面积而不是半径或者直径绘制的。因为如果是基于半径或者直径,那么圆的大小不仅会呈指数级变

2021-12-24 15:52:54 8316

原创 R语言绘图(一)热图

1.什么是热图?在组学研究的相关文章中,我们常常可以看到热图(Heatmap)的展示。这些红绿相间且色彩变化丰富的热图总是能吸引读者的眼球,从而为文章增添不少亮色。当然,作为严谨的科学研究论文,图表的展示当然不可能仅仅是为了好看。热图作为一种对实验数据及其分析结果的直观的表达方式,在很多文章中都有着不可或缺的地位。它是一种将规则化矩阵数据转换成颜色色调的常用的可视化方法,其中每个单元格对应数据的某些属性,属性的值通过颜色映射转换为不同色调并按规则填充单元格。本文我们就来讨论一下热图是如何绘制的以

2021-12-23 17:15:40 17792 1

原创 R语言怎么画火山图

R语言如何绘制火山图1.什么是火山图?​ 火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度FC相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。常应用于转录组,基因组,蛋白质组,代谢组等统计数据。常见问题:1,什么是fold change?翻译成中文是差异倍数,简单来说就是基因在一组样品中的表达值的均值除以其在另一组样品中的表达值的均值。所以火山图只适合展示两组样品之间的比较。2,为什么要做Log 2转换?两个数相除获得的

2021-11-18 14:20:35 11201 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除