1、使用proc sql中的count函数,选择count>1的记录
data aa;
input id $ a b c;
cards;
001 1 2 20
002 2 3 18
002 2 3 18
003 3 4 35
004 4 5 40
004 4 5 60
006 5 6 40
;
run;
proc sql;
create table aa_dup as
select * from aa group by id,a /*按照group by后的字段查重,id、a相同的记录被筛选出来*/
having count(*)>1;
quit;
2、使用proc sort中的nouniquekey查重
proc sort data=aa out=aa_dup1 nouniquekey;
by id a;/*按照by后的字段查重,id、a相同的记录被筛选出来*/
run;
proc sort data=aa out=aa_dup2 nouniquekey;
by _all_;/*by _all_代表按照数据集中所有的变量查重*/
run;