对titanic.csv数据进行预测生死

数据集:http://download.csdn.net/detail/u010343650/9844427

survived:乘客最后的生存情况,这个是我们预测的目标变量 (0代表否,1代表是)

pclass:社会经济地位 (1代表上层阶级,2代表中层阶级,3代表底层阶级)

name:姓名

sex:性别

age:年纪

sibsp:船上兄弟姐妹或者配偶的数

parch:船上父母或者孩子的数量

ticket:船票的号码

fare:船票价格

检查数据的完整性

    # coding:GBK  
    __author__ = 'Mouse'  
    import pandas as pd  
    full_data = pd.read_csv('titanic_dataset.csv')  
    print full_data.info()  
结果显示数据很完整:

代码一:正确率60%-70%之间

# coding:GBK
__author__ = 'Mouse'
import sys
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
reload(sys)
sys.setdefaultencoding('utf8')
from sklearn_test import *

def read_data(data_file):
    data = pd.read_csv(data_file)
    data = data.drop('ticket', axis=1) #删除票信息
    data = data.drop('name', axis=1) #删除姓名

    #one-hot编码
    le_sex = LabelEnc
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值