泰坦尼克号生存预测-决策树算法

最新推荐文章于 2022-06-12 09:40:10 发布

leisure_cc

最新推荐文章于 2022-06-12 09:40:10 发布

阅读量3.7k

点赞数 4

分类专栏：机器学习文章标签： python

本文链接：https://blog.csdn.net/leisure_cc/article/details/123979116

版权

本文介绍了使用决策树算法预测泰坦尼克号乘客生存情况的全过程，包括决策树的重要参数、数据预处理、模型建立、网格搜索优化以及图形化展示。通过对数据的分析和模型调优，揭示了影响乘客生存的关键因素。

摘要由CSDN通过智能技术生成

决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

一、决策树的重要参数介绍

在这里插入图片描述图片引用自：(https://blog.csdn.net/qq_41577045/article/details/79844709)

二、数据预处理

import pandas  as pd 
from sklearn.tree import DecisionTreeClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import GridSearchCV

data=pd.read_csv(r"D:\数据集\泰坦尼克号\train.csv")
#筛选特征,删除无效的及缺失值太高的特征
data.drop(["Name","Ticket","Cabin"],inplace=True,axis=1) #按照列删除，覆盖原数据
#处理缺失值,年龄用均值填补
data["Age"]=data["Age"].fillna(data["Age"].mean())
data.info()

#处理缺失值的行数据
data=data.dropna()  #默认axis=0行数据

#将字符串转换为离散型数值 apply方法
labels=data["Embarked"].unique().tolist()
data["Embarked"]=data["Embarked"].apply(lambda x:labels.index(x))

#性别转换布尔值
data

最低0.47元/天解锁文章

leisure_cc

关注

4
点赞
踩
52

收藏

觉得还不错? 一键收藏
1
评论
泰坦尼克号生存预测-决策树算法

决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录*1. 决策树的重要参数2. 数据预处理3. 建立模型4. 网格搜索优化5. 图形化展示一、决策树的重要参数介绍图片引用自：(https://blog.csdn.net/qq_41577045/article/details/79844709)二、数据预.
复制链接

扫一扫

专栏目录