base SAS programming学习笔记10(combine data)

ddjdd1234

已于 2024-07-17 10:32:27 修改

阅读量540

点赞数 3

分类专栏： SAS 文章标签：学习笔记

于 2024-07-09 17:47:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ddjdd1234/article/details/140290823

版权

SAS 专栏收录该内容

33 篇文章 2 订阅

订阅专栏

1.一对一合并

基本格式如下：

data output-data-set;

set data-set1;

set data-set2;(data-set1和data-set2可以是相同的数据集，可以添加多个set 语句来实现上述的一对一合并)

run;

输出数据集结果如下：

a.会包含所有输入数据的变量名，如果数据集包含相同的变量名，则最后读入的值会覆盖前面读入的值；

b.新的数据集的观测数是以输入数据集最少观测数为准，数据集合并是以位置为前提，即第一行与第一行合并，因此读入最少数据集的结束读入数据标志就会停止执行DATA步导出数据集。

2.纵向合并

基本格式：

data output-data-set;

set data-set1 data-set2;(可以设置多个数据集)

run;

a.合并的数据集必须为相同的类型，如果不是，则会报错；

b.多个输入数据集有相同变量名的话以第一个数据集长度、标签、format和informat为准；

3.交叉合并

基本格式如下：

data output-data-set;

set data-set1 data-set2;(可以是多个SAS数据集)

by variables;

run;

data-set1和data-set2需要提前按照By 语句的变量名进行升序排序。

在data-set1和data-set2 会按照by语句变量名按顺序读取。

4.横向合并

基本格式如下：

data output-data-set;

merge data-set1 data-set2;

by <descending> variables;(可以按倒序排序后横向合并数据集)

run;

如果使用descending则表示变量名按倒序排列，但只对该descending 后连着的变量有用

5.数据横向合并的逻辑

编译阶段：读入MERGE语句设置的输入数据集的相关信息，以及检查DATA步的程序，为合并后的数据创建PDV（程序向量），为MERGE语句中每个数据集创建记录指针(tracking pointer)

执行阶段：SAS会提前检查是否根据BY语句匹配，如果匹配，会放入对应的PDV里面，如果存在相同的变量名称，则来自于前面数据集变量值会决定该变量的类型、长度等，变量值则来源后面对数据集；如果不匹配，则会按顺序依次放入PDV内。

当所有数据集里面BY 语句中的变量值均发生改变该才会将PDV的值设为缺失，否则会保留上一行的数据值。

如下图所示：

BY语句未在所有的数据集里面发生变化：

BY语句在所有的数据集里面发生变化：

使用IN=variable可以追踪观测的来源，该variable是个临时变量，不在SAS数据集里面存在，取值为0和1，如果输出数据集某行有贡献则取值1，否则为0；

如下所示：

该程序表明在demog和visit两个数据集中共有BY 语句变量值的行数被输出到merged数据集中。

上述IF语句可修改如下：

第2个IF语句判断不为0或不为缺失的值

6.SET 语句还可以和DO 循环一起使用

该程序表示，每次执行DATA步则会首先执行IF语句，从第一行读入到最后一行，因为每次重复读入则只会在PDV中存在最后一行。

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
base SAS programming学习笔记10(combine data)

执行阶段：SAS会提前检查是否根据BY语句匹配，如果匹配，会放入对应的PDV里面，如果存在相同的变量名称，则来自于前面数据集变量值会决定该变量的类型、长度等，变量值则来源后面对数据集；b.新的数据集的观测数是以输入数据集最少观测数为准，数据集合并是以位置为前提，即第一行与第一行合并，因此读入最少数据集的结束读入数据标志就会停止执行DATA步导出数据集。(data-set1和data-set2可以是相同的数据集，可以添加多个set 语句来实现上述的一对一合并)set data-set1 data-set2;
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。