一、背景
教材:数据分析方法 第二版 梅长林 范金城 编
软件:SAS 9.4(中文(简体))
二、内容目录
第1章 数据描述性分析
1.1 一维数据的数字特征
1.1.1 表示位置的数字特征
1.1.2 表示分散性的数字特征
1.1.3 表示分布形状的数字特征
三、正文内容
1.1.1 表示位置的数字特征
n个一维数据,,...,——从总体X中观测得到的n个样本观测值,n为样本容量。
1.均值mean
数据中存在异常值时,均值缺乏抗扰性或稳健性,即易受异常值的影响而使其值有较大的变化。
2.中位数Median
受异常值的影响较小,具有较好的抗扰性或稳健性。
3.分位数
上、下四分位数:0.75分位数、0.25分位数
,
4.三均值
SAS 程序通常分为数据步和过程步,一段SAS 程序根据目的和需要可以有0到多个数据步(Data)和0到多个过程步(Proc),还可以有系统选项语句、ODS语句等全局语句。
1.数据步(Data Step)
以关键词Data 开头,可由多条语句构成,结束标志可以是空语句、Run 语句、过程步或下一步数据步。
数据步功能有:
(1)从外部文件中读取数据;
(2)将数据写入到外部文件中;
(3)读取SAS数据文件和视图;
(4)创建SAS数据文件和视图。
2.过程步(Proc Step)
以关键词Proc 开头,可由多条语句构成,结束标志是Run或Quit 语句。
过程步的功能有:
(1)调用 SAS 过程(SAS Procedures)分析和处理SAS数据集形式的数据,或执行其他分析;
(2)将分析结果以报表、图表的形式输出,或输出成 SAS数据集、外部文件;
(3)生成SQL查询;
(4)数据操作和管理。
proc univariate:对单变量做统计分析
例1.1 对某学校100名女学生测定血清蛋白含量(单位:g/L),数据如下:
74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5
79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0
75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0
73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5
75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0
70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3
73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7
67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7
75.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.3
73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4计算均值,中位数&#x