假设手上有个随机变量的n个样本值,想确定这个随机变量的概率分布,怎么做?
图像观察
首先在使用一些‘高大上’的统计方法之前,我们可以先把样本的histograme和density function先plot出来,肉眼观察一下看和哪个概率分布相似。这个方法比较主观,也很难得出一个准确的判断,但不妨碍我们先做到心中有数。
# import excel file
x <- read_excel('fit solar distribution.xlsx',skip = 2)
hist(x). ## 柱状图
plot(density(x)) ## 概率密度图
plot(ecdf(x),main="Empirical cumulative distribution function") ## 累积概率密度