SAS(二)SAS基本数据类型及SAS基本模块的介绍
SAS基本介绍
SAS 是英文Statistical Analysis System的缩写,翻译成汉语是统计分析系统,最初由美国北卡罗来纳州立大学两名研究生研制,1976 年创立SAS公司, 2006年全球员工总数10000人,全球财富500强中的前100家企业有96家使用SAS软件进行“商业智能(Business Intelligence, BI)”上的应用,SAS软件采用按年租用收费制,2005年SAS公司收入16.8亿美元。在数据处理领域,SAS系统具有十分完备的数据访问、数据管理、数据分析和数据呈现的功能。国际上, SAS被誉为数据统计分析的标准软件。SAS软件是一个模块组合式的系统,共有三十多个功能模块,其中最基础的是BASE模块,专门用于统计分析的有STAT模块,专门用于时间序列分析的有ETS模块。SAS软件是用汇编语言编写而成的,使用SAS软件通常需要编写程序,因此比较适合专业统计人员使用,非统计专业人员学习SAS比较困难,SAS软件最新版为9.13版,SAS公司的网址是http://www.sas.com。
SAS基本数据类型
数据集:数据的集合,由样本(行)和变量(列)组成
a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别)
|
变量1 |
变量2 |
变量3 |
变量4 |
样本1 |
|
|
|
|
样本2 |
|
|
|
|
样本3 |
|
|
|
|
样本4 |
|
|
|
|
b.时间序列数据集(time series data set):是由一个或几个变量在不同时间的观测值所构成的。
|
变量1 |
变量2 |
变量3 |
变量4 |
时间1 |
|
|
|
|
时间2 |
|
|
|
|