python决策树泰坦尼克生还预测

今天用sklearn模块中的决策树部分简单的尝试了一下泰坦尼克生还问题


import pandas as pd
from sklearn.tree import DecisionTreeClassifier as DTC

data=pd.read_csv('train.csv')
data=data.drop('PassengerId',1)
data.loc[data['Sex']=='male','Sex']=1
data.loc[data['Sex']=='female','Sex']=0
x=data.loc[:,['Pclass','Sex','Parch','Fare','SibSp']]
y=data.loc[:,'Survived']
#dtc=DTC(criterion='entropy')
dtc=DTC(criterion='gini')
dtc.fit(x,y)
print(dtc.score(x,y))
test=pd.read_csv('test.csv')
test.loc[test['Sex']=='male','Sex']=1
test.loc[test['Sex']=='female','Sex']=0
testpart=test.loc[1:100,['Pclass','Sex','Parch','Fare','SibSp']]
#print(testpart)
print(dtc.predict(testpart))

样本中的属性很多我从中选取了几个简单的进行测试,其中性别属性转换成了0,1
测试集选取了前100个进行了测试,结果如下:



训练集预测准确率大致为0.922558922559

数据集的下载http://download.csdn.net/download/cool_jia/10268620


 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值