本博客所有内容是原创,未经书面许可,严禁任何形式的转载。
http://blog.csdn.net/u010255642
茎叶图
R使用stem函数,格式为:
stem(变量,scale=长度,width=绘图宽度,atom=容差)
我们绘制一下产品单位成本的茎叶图:
>read.table("I:/my_docs/cp.csv",,header=TRUE,sep=",")->cp
> stem(cp$单机成本.元.台.,scale=2)
The decimal point is 1 digit(s) to the right of the |
29 | 68
30 | 1356778
31 | 1135
32 | 7
33 |
34 | 36
Scale为2,表示将个数位分成2段,0-4一段,5-9一段。
从茎叶图中可看出,单位成本主要集中在300元-400元
箱线图
R的相应函数为:boxplot
> boxplot(jiuye$平均教育经费)
下图中间那个箱子的顶部是上四分位数,底部是下四分位数,中间的粗线是中位数位置,箱体由上下伸出的垂直部分表示数据的散布范围,另外在散布范围外还有一些小圆点,那些是异常点,可见平均教育经费有一些特大值,最大的异常值超过了12000。
五数
R中使用fivenum函数
> fivenum(cp$单机成本.元.台.)
[1] 296.210 304.275 307.225 313.915 346.230
>
分别是最小值,下四分位数,中位数,上四分位数,最大值。