对于一个工厂企业,我们知道在把“原材料”运送到厂里时需要进行安检。每一条数据就类似一个行李,你得符合厂里的标准才能给你过安检进入厂。还有就是你不同的行李应该按照不同的安检标准进行安检。同时,安检站会记录今天有多少件行李,都是什么类型的,然后分配到不同的厂库。
SAS是对数据的加工厂,有着自己的管理规则以及标准运行流程。在读入数据的时候,就类似上述工厂原材料。经过安检这个缓冲区(buffer),没有问题就继续运送到SAS对应的逻辑库中。
同时,你在安检之前,你是可以选择只带行李里边的某一些东西或者你可以选择放弃行李里边的哪些物件。当然,你也可以说,我全要。
sas读入数据时也是允许你对数据进行这样的操作的。你可以选择某一条观测里边的哪些变量或者放弃一条观测里边的哪些变量。
(sas的数据形式是行代表观测,列代表变量。具体的可以看看sas自带数据库的数据格式:
proc print data = sashelp.class;
run;
)
sas也会记录一共读了多少条,也会有一些指示变量来记录一些关于观测的信息。例如:第一条观测,最后一条观测,来自同一个数据集的标志,读入错误记录变量等等。
记住这个安检的先后顺序,在后面学到一些data步语句使用的顺序很关键。(对于数据集的操作可以在两个环境下进行操作。一.安检读入数据的时候,二.sas数据库中的数据。这两者用的操作语句都是相同的,很表达形式以及顺序很重要)。