变异系数曲线
1.什么是变异系数曲线?
变异系数(Coefficient of Variation):当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,而变异系数可以做到这一点,它是原始数据标准差与原始数据平均数的比。CV没有量纲,这样就可以进行客观比较了。事实上,可以认为变异系数和极差、标准差和方差一样,都是反映数据离散程度的绝对值。其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。(百度百科)
它的计算方式也很简单,CV=标准差/平均值
变异系数曲线就是基于变异系数画的经验累积分布曲线。
经验累积分布函数可以参考上篇推文。
2.绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/CV/CV.zip下载。
2.1 CV数据
包含2个维度的数据,用生物学常用的搜库结果举例。每一列是个样本,每一行是个基因。
2.2 分组数据(可选)
包含2列数据,第一列为刚才的样本名称,第二列为分组名称。
分组数据是可选的,如果没有上传,则默认只有一个分组。
3. R语言怎么计算变异系数
# 读取数据文件
df = read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/ecdf/demo.txt",
row.names = 1)
# 计算
cal_cv=function(x){ # 自定义函数 标准差/平均值
y=na.omit(x)
return(sd(y)/mean(y))
}
apply(df, 1, cal_cv) # 在每一行上应用自定义cal_cv函数
4. BioLadder生信云平台在线绘制变异系数曲线
不想写代码?可以用BioLadder生信云平台在线绘制变异系数曲线。
网址:https://www.bioladder.cn/web/#/chart/45