python决策树泰坦尼克生还预测

最新推荐文章于 2023-02-08 21:52:49 发布

cool_jia

最新推荐文章于 2023-02-08 21:52:49 发布

阅读量858

点赞数

分类专栏： python&chart

本文链接：https://blog.csdn.net/cool_jia/article/details/79437335

版权

python&chart 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

今天用sklearn模块中的决策树部分简单的尝试了一下泰坦尼克生还问题

import pandas as pd
from sklearn.tree import DecisionTreeClassifier as DTC

data=pd.read_csv('train.csv')
data=data.drop('PassengerId',1)
data.loc[data['Sex']=='male','Sex']=1
data.loc[data['Sex']=='female','Sex']=0
x=data.loc[:,['Pclass','Sex','Parch','Fare','SibSp']]
y=data.loc[:,'Survived']
#dtc=DTC(criterion='entropy')
dtc=DTC(criterion='gini')
dtc.fit(x,y)
print(dtc.score(x,y))
test=pd.read_csv('test.csv')
test.loc[test['Sex']=='male','Sex']=1
test.loc[test['Sex']=='female','Sex']=0
testpart=test.loc[1:100,['Pclass','Sex','Parch','Fare','SibSp']]
#print(testpart)
print(dtc.predict(testpart))

样本中的属性很多我从中选取了几个简单的进行测试，其中性别属性转换成了0，1

测试集选取了前100个进行了测试，结果如下：