画图是生物信息分析中的高频动作,在第二讲《错过她,也不能错过的R语言》中,我们留下一个彩蛋,今天来放送答案。
在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。
柱状图一般用于离散变量绘图,那离散变量指的是什么呢?
小板报离散变量是指其数值只能用自然数或整数单位计算的则为离散变量。
反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。
在ggplot2中绘制柱状图使用的几何对象是geom_bar(),默认的统计变换是stat_count(对映射到x轴的变量计数),如果我们的数据不需要默认的计数统计变换,且已经做好统计变换,只需要直接绘图,设置参数geom_bar(stat='identity') 即可。
柱形图一般有3种形式,1)填充式;2)堆积式;3)并列式。
首先,我们模拟一个包括3列的数据,并赋值给data变量,用head(data)函数查看前6行,展示如下:
specie ->
condition ->
value ->
data ->