查看连续变量的分布情况,频率分布直方图。直接上histogram语句就行。
举个栗子,要画一个简单的直方图,只要如下三行:
proc sgplot data=sashelp.cars ;
histogram enginesize;
proc sgplot data=sashelp.cars ;
histogram enginesize;
density enginesize;
proc sgplot data=sashelp.cars;
histogram mpg_city ;
histogram mpg_highway ;
举个栗子,要画一个简单的直方图,只要如下三行:
proc sgplot data=sashelp.cars ;
histogram enginesize;
run;
proc sgplot data=sashelp.cars ;
histogram enginesize;
density enginesize;
run;
请注意,在直方图区域的底部和上图中的x轴之间引入了一个小间隙。 y轴上的“零”刻度和值略高于x轴线。 这是为了允许重叠密度绘图线的厚度,因此线条不会夹在底部。 默认情况下创建一个图例,包括密度曲线,我们使用KEYLEGEND语句来自定义其在数据区域内的位置。
proc sgplot data=sashelp.cars ;
histogram enginesize;
density enginesize;
density enginesize / type=kernel lineattrs=(pattern=solid); /*核密度曲线估计也可以加进去*/
keylegend / location=inside position=topright across=1 noborder linelength=20;
yaxis offsetmin=0;
run;
有的时候,我们希望把两个类似变量的直方图放一张图里比较,如何做?同理,那就再加一个histogram语句!
proc sgplot data=sashelp.cars;
histogram mpg_city ;
histogram mpg_highway ;
run;