前面我们已经介绍了如何应用SAS实现数据的准备,今天我们就要开始介绍如何应用SAS数据的统计描述。统计描述通常是描述或概括数据的主要特征,有利于确定进一步分析的方向。统计描述的结果主要是以统计指标、统计表和统计图来呈现。Base软件是 SAS系统的基本部分,主要用于:信息存储和检索、数据修改和程序设计、基础统计计算、报表生成和文件管理,前面我们已经介绍了数据整理方法的相关应用。Base SAS软件还提供了几十个过程,可以简便、有效地完成基础统计计算、生成统计表和统计图。Base SAS过程按照它们的用途主要可以归为以下几类:基础统计计算、图表生成、得分过程和其他实用过程。今天我们主要介绍Base SAS的基础统计计算过程。(详见图4-1)
导图
一、统计描述指标的基础知识
获取数据信息最基本的方法就是统计描述,统计描述是指用统计指标和适当的统计图表来描述资料的分布规律和其数量特征。数据的统计描述一般根据数据数据类型和其分布特征来选用适当的统计指标和统计图。下面我们就简单介绍统计指标的概念和如何正确选用统计指标(详见图6-2)。(一)定量数据的统计描述
1.1 描述集中趋势的统计指标
算术均数(arithmetic mean):简称为均数,用于说明一组观察值的平均水平或集中趋势,是描述定量数据最常用的方法,记为 。算术均数易于理解,结果较稳定,应用广泛。主要适用于对称分布或偏度不大的资料,尤其适合于正态分布数据,但易受频数分布尾端极大和极小的影响。
几何均数(geometric mean):当观察值间按倍数关系变化时,如:抗体满意度、细菌计数、血清凝集效价等,则可以计算其几何均数,记为G。几何均数多用于:(1)血清学和微生物学的资料;(2)有些明显偏态分布,经过对数变换后呈对称分布的资料。对数变换时,其值不能为0或负数,如观察值