一 、可比较的内容如下:
1:数据集的属性是否一致
2:变量及属性是否一致
3:观测是否一致
以下时2个用来练习的简单数据集,可运行相应代码查看结果:
data one;
infile datalines delimiter = ',';
input id $ name $ status $ grade $ ;
datalines;
001,huahua,A,A
002,gaga,B,B
003,cici,C,C
004,qiqi,D,D
005,mumu,E,D
;
run;
data two;
infile datalines delimiter = ',';
input id $ name $ state $;
datalines;
001,huahua,A
002,gaga,B
003,cici,C
004,qiqi,D
005,mumu,E
;
run;
二、不同的比较类型
2.1 基本比对
以下代码会对数据集的方方面面进行全面比对,选项printall 会将所有的比对结果打印出来。
PROC COMPARE BASE = one COMPARE = two PRINTALL;
RUN; /*PRINTALL option prints a full report of the differences */
2.2 比较不同数据集中的变量
指定比对变量时若变量名一致,则只需VAR语句,若不一致,则需WITH 语句。
PROC COMPARE BASE = one COMPARE = two ;
VAR