SAS初学者笔记---005---数据的分割及选择

最新推荐文章于 2023-06-21 17:20:08 发布

wrenb

最新推荐文章于 2023-06-21 17:20:08 发布

阅读量4.7k

点赞数 5

分类专栏： sas学习笔记文章标签： sas

本文链接：https://blog.csdn.net/weixin_42425562/article/details/113091176

版权

sas学习笔记专栏收录该内容

7 篇文章 11 订阅

订阅专栏

SAS初学者笔记---005---数据的分割及筛选

关于数据的分割及筛选，个人认为这是数据清洗诸多步骤中首要的一步，关于数据清洗的概念请看官移步至其他博客。
而在本章介绍的数据的分割及筛选主要包括以下语句：

if，where，IF语句除用作判断结构外，还可以同WHERE对已知数据集的筛选
output，delete （if）选择观测（横行）是否被输出到数据集中，通常与判断结构联用
drop，keep，选择变量（纵行）是否被输出到数据集中

DROP/KEEP 对变量的选择

DROP声明不输出到数据集中的变量
KEEP声明输出到数据集中的变量
在这里插入图片描述
KEEP的使用逻辑是指示需要保留的变量名，DROP需要指示不需要保留的变量名。以上两语句若不指示变量，则视为全保留

OUTPUT/DELETE 对观测的选择

一般情况sas程序在读取数据时往往会经历一个循环后才会将一个观测输出到数据集中，但是在某些特殊的数据构造需要下，需要在一次循环中多次输出观测（如卡方分析的数据构造），此时便需要使用OUTPUT语句，同时也有删除不满足需求的观测的需要，此时便需要使用DELETE语句，举例如下：
在这里插入图片描述
如果在DATA 步中使用了OUTPUT语句，每次迭代结束时就不会自动将观测写入任何数据集。因此，一旦在程序使用了OUTPUT语句，则必须为所有需要写入数据集的观测使用OUTPUT语句

IF/WHERE 选择观测

使用IF语句选择观测

sas-HELP
在这里插入图片描述

使用WHERE语句选择观测

sas-HELP
WHERE与IF的功能相似，但WHERE与IF语句之间存在本质的区别，关于此部分内容撰写时我搜集了许多的资料，其中无一例外都有提到

WHERE与IF的筛选及读数据入PDV这两步的顺序差异（Where从buffer中进行筛选再读入pdv，If先读入pdv再进行筛选）这样的模式是导致的结果就是使用where筛选出的数据是在输出至PDV就已形成好的，而使用IF筛选出的数据是在PDV形成后再筛入数据集中。关于PDV的解释详看以下文档：经管之家，CSDN
此外WHERE能作用于整段代码，而IF仅对其下方的代码生效

我又在B站上看到了这一视频——关于where与if。
举例如下

data test;
    set sashelp.class end=eof nobs=obs;
	IF sex = 'F';
    var=eof;
	put name=  sex=  obs=;
/*	IF sex = 'F';*/
/*	where sex = 'F';*/
run;

proc print data=test;
run;

代码如上，建议复制到本地自行试验。
需要特别解释以下代码中的几个关键词：