sas 做 titanic 未完待续

首先声明,纯属个人爱好,看网上都是R或者Python做的titanic预测,心血来潮想用sas做一下,个人比较倾向于sas,因为用的时间比较长相对熟练,欢迎大家一起研究指教,本人不是专业的,纯属娱乐,图个高兴,大家都别太当真。

         ***Kaggle 的经典赛题:泰坦尼克号生还者预测***
    

步骤1:

首先下载要用到的文件        
     网址如下 
     https://www.kaggle.com/c/titanic/data
     三个文件 train.csv test.csv gender_submission.csv
     

   
    然后在sas里给它们打开,这里我们用proc import导入文件,程序如下
    proc import 
    datafile="../.../train.csv"   /* 双引号" "里添加文件所在的位置,注意这里是 / 不是 \ */ 
        out=train  /*文件输出名*/
        dbms=csv replace;  
        getnames=yes;
        run;
        

我们先来看一下这三个文件里面分别有什么
train.csv 包含了passengerID 为1到891的乘客的所有信息

clipboard.png

test.csv 包含了passengerID 为892到1309的乘客的部分信息,不包含survival幸存这一列

clipboard.png

gender_submission.csv 包含了passengerID 幸存者一列

clipboard.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值