泰坦尼克号生存预测-决策树算法

决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

目录

*1. 决策树的重要参数
2. 数据预处理
3. 建立模型
4. 网格搜索优化
5. 图形化展示

一、决策树的重要参数介绍

在这里插入图片描述图片引用自:(https://blog.csdn.net/qq_41577045/article/details/79844709)

二、数据预处理

import pandas  as pd 
from sklearn.tree import DecisionTreeClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import GridSearchCV

data=pd.read_csv(r"D:\数据集\泰坦尼克号\train.csv")
#筛选特征,删除无效的及缺失值太高的特征
data.drop(["Name","Ticket","Cabin"],inplace=True,axis=1) #按照列删除,覆盖原数据
#处理缺失值,年龄用均值填补
data["Age"]=data["Age"].fillna(data["Age"].mean())
data.info()

#处理缺失值的行数据
data=data.dropna()  #默认axis=0行数据

#将字符串转换为离散型数值 apply方法
labels=data["Embarked"].unique().tolist()
data["Embarked"]=data["Embarked"].apply(lambda x:labels.index(x))
  • 4
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值