SAS(十二)PROC步

SAS(十二)PROC步

  • Proc- 用在proc步的开头并规定用户使用的SAS过程名字及其他信息
  • Var-规定用这个过程分析的一些变量
  • Model-规定在模型中类似表示因变量(左)和自变量(右)的这样一些变量及其他信息
  • Weight-规定一个变量,它的值是这些观测的相应权数
  • Freq-规定一个变量,其值表示频数
  • Id-规定一个或几个变量,他们的值在打印输出中或由此过程产生的SAS数据集中用来识别观测
  • Where-在SAS把观测引入proc步之前,用来选择符合特殊条件的观测
  • Class-在分析中指定一些变量为分类变量
  • By-规定一些变量,SAS过程对输入数据集用by变量定义的几个数据组分别进行分析处理
  • Output-给出用该过程产生的输出数据集的信息
  • Quit-结束交互式的过程
  • 其他如Attrib属性语句、format输出格式语句、label标签语句等

 

data insurance;                                                                                                                         
  input id y x1 x2;                                                                                                                     
  label id="序号" y="人寿保险额(千元)" x1="年人均收入(千元)" x2="风险反感度";                                                           
  cards;                                                                                                                                
1  19.6 66.290 7                                                                                                                        
2  6.3  40.964 5                                                                                                                        
3  25.2 72.996 10                                                                                                                       
4  8.4  45.010 6                                                                                                                        
5  12.6 57.204 4                                                                                                                        
6  1.4  26.852 5                                                                                                                        
7  4.9  38.122 4                                                                                                                        
9  26.6 75.796 9                                                                                                                        
10 4.9  37.408 5                                                                                                                        
11 10.5 54.376 2                                                                                                                        
12 9.8  46.386 7                                                                                                                        
13 7.7  46.130 4                                                                                                                        
14 1.4  30.366 3                                                                                                                        
15 5.6  39.060 5                                                                                                                        
16 24.5 79.380 1                                                                                                                        
17 13.3 52.766 8                                                                                                                        
18 13.3 55.916 6                                                                                                                        
;                                                                                                                                       
proc reg;                                                                                                                               
model y=x1 x2;                                                                                                                          
run;

 

 

Transpose(转置过程)

  1. Transpose过程完成对sas数据集的转置,即把观测变为变量,变量变为观测。
  2. Out选项规定输出数据集
  3. Prefix选项规定转置后的变量名前缀
  4. Id选项使用其后规定的变量值作为输出数据集中被转置的变量名
title;                                                                                                                                  
data aaa;                                                                                                                               
input m1-m3 x $;                                                                                                                        
cards;                                                                                                                                  
2 2.5 5.5 a                                                                                                                             
;                                                                                                                                       
run;                                                                                                                                    
proc transpose data=aaa out=zzz;                                                                                                        
var m1 m2 m3 ;                                                                                                                          
*id x;                                                                                                                                  
run;                                                                                                                                    
proc print data=zzz;                                                                                                                    
run;

 

 

Means均值过程

  1. 计算数据集中数值变量的简单统计量
  2. T选项:检验数据总体均值为0的假设时,t统计量的值
  3. Prt选项:Prob >|T| , 数据总体均值为0的概率是多少
  4. 默认生成的_type_和_freq_变量分别规定分组数(如果有)和频率
  5. Maxdec选项规定输出结果的小数部分最大位数
  6. 可以输出的统计量:
    N, Nmiss, mean, std, min, max, range, sum, var, uss, css, cv(变异系数), stderr, t, prt, sumwgt, skewness(偏度), kurtosis(峰度), clm(置信限), lclm(置信下限), uclm(置信上限)
data x;                                                                                                                                 
   title '与正常体重的偏差';                                                                                                            
   input x @@;                                                                                                                          
   cards;                                                                                                                               
-7  -2 1 3 6 10 15 21 30                                                                                                                
;                                                                                                                                       
proc means data=x maxdec=2 n range mean median std stderr t prt;                                                                        
     output out=x1 mean=X_mean std=X_std;                                                                                               
run;                                                                                                                                    
proc print data=x1;                                                                                                                     
run;

 

data;                                                                                                                                   
input class $ a amount;                                                                                                                 
cards;                                                                                                                                  
a 3 0.8                                                                                                                                 
b 4 0.2                                                                                                                                 
;                                                                                                                                       
run;                                                                                                                                    
proc means n mean;                                                                                                                      
var a;                                                                                                                                  
weight amount;                                                                                                                          
run;

data;                                                                                                                                   
input class $ a amount;                                                                                                                 
cards;                                                                                                                                  
a 3 3                                                                                                                                   
b 4 2                                                                                                                                   
;                                                                                                                                       
run;                                                                                                                                    
proc means n mean;                                                                                                                      
var a;                                                                                                                                  
freq amount;/*freq后规定的变量,其值不能小于1*/                                                                                         
run;

 

Format过程

  1. 使用Format过程把输出格式同Data步、Proc步的变量联系起来。
  2. 输出格式一:SAS格式
  3. 输出格式二:Format定义的格式,形如value 格式名 变量值=‘自定义值’;
    proc …;
    format 变量 格式名.;
  4. 输出格式三:图示输出,只适用于数值型变量,形如
    picture 格式名 other=’格式化值’;
    proc …;
    format 变量 格式名.;
proc format;         
  • 6
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
数据分析,数据科学及AI算法是当前最热门的职业。这些职业有着共同的特点:面向数字的,针对编程的以及采取分析手段的。 这些当代热点特性使得在就业市场上对以上职位需求激增也就不足为奇了。但是,市场上提供这方面的大型综合的培训课程是有限,如果说有,大多是知识范围狭窄且非综合性的,而且大多培训都缺乏方法论与实务结合。一般的情况是讲师讲述某种语言的一堆代码,学生听完后甚至连使用方法及代码的前提都不清楚,更别提实际应用场景了。这里,掌握一门数据分析软件本身没错,但仅通过单一的编程培训很难获得聘用为数据分析师或数据科学家所需的技能。那我的解决方案是什么呢?首先,我把所有数据分析中的典型问题都归类总结出来,再结合相应的实际问题,数据以及案例,同时采用世界上最流行的两种数据分析软件:PYTHON 和 SAS去解决这些问题,并将这些解决方法传授给学生。学生在完成培训后更重要的收获是知道每一问题从产生直至解决的前因后果和应用场景,这是因为我在每一课程章节最前都会交代方法论,知识要点及应用场合。SAS和PYTHON可以一起学吗?当然可以。因为我就是这样做到的。具体骤是,我在课程当中安排了一系列主题,然后使用两种编程语言解决同样的问题。我总结出这样做的好处是边学习边比较,最后在不知不觉当中掌握了两门语言的精华和数据分析的通用方法或模式。过程虽有点长,但十分有趣。最后,为了巩固已学的知识和技能,我还专门安排了针对PYTHON 和 SAS的中小型项目及详细代码讲解。另外,课程当中使用的全部编程代码及数据文件都将免费地提供给注册的学生。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

路易三十六

你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值