infile指令使用总结
1、firstobs和obs指令,firstobs用于指定读入数据的起始行;obs用于指定读入数据的终止行。如
infile 'c:\temp.txt' firstobs=2 obs=100;
2、flowover/missover/truncover/stopover指令,该指令都用于读取记录末尾不完整的数据时使用,flowover是默认选项。
flowover:为infile语句的默认选项,如果当前的所读观测值长度小于变量长度时,跳过该观测,直接读入下一条观测值(不管下一条观测长度是否小于变量长度);
missover:如果当前所读观测值长度小于变量值,则用缺省值代替,然后继续读下一条观测;
truncover:读入所有观测;
stopover:当前所读观测值长度小于变量长度时,退出input语句,设置_error_=1;
scanover:当前记录行找不到@'character-string'表达式指定的字符串时,继续读取下一行,直到找到为止。
3、dsd(delimiter-sensitive data)指令,指定分隔符,默认为逗号(用delimiter='str'来指定分隔符)。
该指令可以将分隔符之间的数据作为一个独立的数据项进行分隔,但是会忽略引号内的分隔符,也就是将引号内的数据作为一个整体来看。
libname mydb 'c:\mydb';
data mydb.scores;
infile datalines dsd;
input Name: $9. Score /*冒号是告诉SAS遇到分隔符时停止读取,否则会读取默认的数位(即取8个字节长度)*/
Team: $25. Div $;
datalines;
Joseph,76,"Red Racers, Washington",AAA
Mitchel,82,"Blue Bunnies, Richmond",AAA
Sue Ellen,74,"Green Gazelles, Atlanta",AA
;
run;
proc print;
run;
4、LINESIZE指令,指明读入记录的长度,最大为32767,默认为256。用于输入数据文件数据行大于
256时,防止超过长度的数据丢失。
infile datalines dsd ls=1024;
5、infile n表示一次读取n行
1、firstobs和obs指令,firstobs用于指定读入数据的起始行;obs用于指定读入数据的终止行。如
infile 'c:\temp.txt' firstobs=2 obs=100;
2、flowover/missover/truncover/stopover指令,该指令都用于读取记录末尾不完整的数据时使用,flowover是默认选项。
flowover:为infile语句的默认选项,如果当前的所读观测值长度小于变量长度时,跳过该观测,直接读入下一条观测值(不管下一条观测长度是否小于变量长度);
missover:如果当前所读观测值长度小于变量值,则用缺省值代替,然后继续读下一条观测;
truncover:读入所有观测;
stopover:当前所读观测值长度小于变量长度时,退出input语句,设置_error_=1;
scanover:当前记录行找不到@'character-string'表达式指定的字符串时,继续读取下一行,直到找到为止。
3、dsd(delimiter-sensitive data)指令,指定分隔符,默认为逗号(用delimiter='str'来指定分隔符)。
该指令可以将分隔符之间的数据作为一个独立的数据项进行分隔,但是会忽略引号内的分隔符,也就是将引号内的数据作为一个整体来看。
libname mydb 'c:\mydb';
data mydb.scores;
infile datalines dsd;
input Name: $9. Score /*冒号是告诉SAS遇到分隔符时停止读取,否则会读取默认的数位(即取8个字节长度)*/
Team: $25. Div $;
datalines;
Joseph,76,"Red Racers, Washington",AAA
Mitchel,82,"Blue Bunnies, Richmond",AAA
Sue Ellen,74,"Green Gazelles, Atlanta",AA
;
run;
proc print;
run;
4、LINESIZE指令,指明读入记录的长度,最大为32767,默认为256。用于输入数据文件数据行大于
256时,防止超过长度的数据丢失。
infile datalines dsd ls=1024;
5、infile n表示一次读取n行