题目地址:Titanic: Machine Learning from Disaster
相关的测试集和训练集我在excel进行了稍微的调整,链接:提取码: mdwi
分数不高,但是用的都是最基本的知识
from sklearn.tree import DecisionTreeClassifier
import pandas as pd
import warnings
from sklearn import tree # 导入决策树
import graphviz
"""
打印处理
"""
# 不显示warning
warnings.filterwarnings('ignore')
# 显示所有列
pd.set_option('display.max_columns', None)
# 显示所有行
pd.set_option('display.max_rows', None)
# 显示宽度为1000
pd.set_option('display.width', 1000)
def prep(csvfile):
"""
数据预处理
"""
df = pd.read_csv(csvfile)
# Embarked 1 = Cherbourg, 2 = Queenstown, 3 = Southampton
target1, target2, target3 =