基本格式:
DATA = data-set 对哪个数据集进行排序
OUT = data-set 把排序后的数据输出到指定数据集中,此时原数据依然保留。
如果不加该选项,排序后的数据集将覆盖原有数据集,这样就找不回原数据了
PROC SORT <DATA = data-set> <OUT = data-set> <nouniquekey> <nodupkey>;
BY <descending> variable-list;
RUN;
选项nouniquekey——输出重复值
PROC SOORT DATA=sasusser.xb nouniquekey out=rep;//把输出的重复值保存到数据集rep中
BY name gender;
PROC PRINT DATA=rep;
RUN;
选项nodupkey——输出唯一值(删除重复值)
重复值中关于重复的定义:by后面跟的变量是否全部相同
PROC SOORT DATA=sasusser.xb nodupkey out=norep;//把输出的唯一值保存到数据集norep中
BY name gender;
PROC PRINT DATA=norep;
RUN;
BY语句:
-
指定排序变量,可以指定多个
-
descending:表示降序排序,默认按升序排序。
-
排序遇到缺失值,按最小值处理