关于hist()函数与geom_histogram()
写论文时,我使用R画频数分布图时,我发现R自带的hist()与ggplot2中的geom_histogram()画出来的图有区别,开始我直接使用geom_histogram()画频数分布直方图添加密度曲线以及正态分布曲线图时,画出来了这样的图,这离大谱,函数没错,画出来这是什么玩意儿。
解决方法
画了hist()line(density())的图像,反复对比多次,我发现两张图纵坐标数值有很大差异。我就尝试调试geom_histogram()中的参数,最后我发现:
hist()中的函数无论nclass参数怎么调整,直方图的总是与序列的密度曲线能够很好的拟合,但是geom_hisotgram()+geom_density(bins=,bindwith=)中两个参数的调整会严重影响每个区域里面的频数,这也就出现柱子与密度曲线相差很大的情况。最后增加了区域数量后得到了个较满意的图像。hist()怎么调nclass都不会变,唉,这就很好。
但是这线让我觉得它好丑,与我用ggplot的初衷完全不符,还是分开画。
贴个画ggplot画正态分布密度曲线的码,都没有人写过
p+geom_density(color='black')+
stat_function(fun=function(x)
dnorm(x,
mean = mean(df$lsr),
sd=sd(df$lsr)),
color='red')