之前的文章我们提到在做SDTM和ADAM数据集的时候很多数据需要外部导入,外部导入基本都会用import程序步和csv文件,在导入的时候往往会发生各种情况,诸如路径不存在,窜行,乱码和无法导入。
filename filename "路径" encoding="gb2312";
proc import datafile=filename out=dataname dbms=csv replace;
getnames=no;
guessingrows=max;
run;
路径不存在基本就是文件名称错误或者真的是路径错误或者setup程序修改完了以后没有run造成的,这个比较容易解决。导入的文件如果发生窜行很有可能是csv文件里面有换行符。
比较让人头疼的是乱码问题,尤其是中文,很容易乱码,这个时候可以加上encoding="gb2312"这段代码指定导入文件的编码,往往这个时候乱码问题就会解决,屡试不爽,所以我们会习惯性的在导入csv文件的时候加上encoding="gb2312"。
。。。。。。。。。。。。。。。。。
版权原因,完整文章,请参考如下:IMPORT导入CSV文件乱码问题