scikit-learning 决策树用于泰坦尼克号生还数据

最新推荐文章于 2022-04-27 21:03:40 发布

pynash123

最新推荐文章于 2022-04-27 21:03:40 发布

阅读量237

点赞数

分类专栏：机器学习算法 python

本文链接：https://blog.csdn.net/pynash123/article/details/89323772

版权

数据为泰坦尼克号人员数据，预测是否生还
使用sklearn.tree.DecisionTreeClassifier生成分类决策树
利用GridSearchCV选择最优参数组合

import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

def read_data(file_path):
    data = pd.read_csv(file_path, index_col=0)
    print(type(data))
    print(data.shape)
    print(data.head())
    print(data.index)
    print(data.columns)
    #删除无用列，inplace=True会将列完全删除,不然只是将对应列值置为空
    data.drop(['Name', 'Ticket', 'Cabin'], axis=1, inplace=True)
    #性别转换为0 1
    data['Sex'] = (data['Sex'] == 'male').astype('int')
    # 处理登船港口数据  'S', 'C', 'Q', nan 分别对应 0 1 2 3
    labels = data['Embarked'].unique().tolist()#['S', 'C', 'Q', nan]
    data['Embarked'] = data['Embarked'].apply(lambda n: labels.index(n))

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pynash123

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scikit-learning 决策树用于泰坦尼克号生还数据

import matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitimport numpy as npimport pandas as pdfrom sklearn.tree import DecisionTreeClassifierdef read_data(file_path): ...
复制链接

扫一扫