本期目标:
利用累积分布函数可以很清晰的描述一个随机变量的概率分布。
笔者在这里只阐述如何计算累积分布函数。
数据准备:
如图1,笔者想从检出频率和响应两个变量角度来描述一组化合物检出的分布情况。共有667个特征,则首先将这两个变量从小到大排列,
第一个累积概率数值 A1 等于1/667
第二个累积概率数值 A2 等于A1+1/667
第三个累积概率数值 A3 等于A2+1/667
…
…
注:在输入A2的计算方式后,可以在excel中选中A2表格,双击表格右下角自动填充(当然,笔者在计算时候也将累积概率列按1,2,3,4…667排序,并分别除以667,由此得到的数据列作为绘图所需的累积概率列。)
图1 数据准备
接下来将计算的数据与两个变量数据对应,利用origin或Excel绘制散点图即可。
散点图绘制可参考: