数据分析实战之决策树（泰坦尼克号乘客生存预测）

最新推荐文章于 2024-04-30 12:12:39 发布

柚子哦

最新推荐文章于 2024-04-30 12:12:39 发布

阅读量8.9k

点赞数 11

分类专栏：数据分析实战

本文链接：https://blog.csdn.net/hahaha66888/article/details/87688245

版权

本文利用已给特征属性和存活与否标签的训练集和只包含特征信息测试集数据，通过决策树模型来预测测试集数据乘客的生存情况

数据集来源为https://github.com/cystanford/Titanic_Data，可下载数据查看其各字段信息

生存预测的流程：

1、数据探索：

import numpy as np
import pandas as pd

train_data = pd.read_csv(r'C:\Users\hzjy\Desktop\train.csv')  #加载数据
test_data = pd.read_csv(r'C:\Users\hzjy\Desktop\test.csv')

1）训练集数据的整体特征：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

柚子哦

关注关注

11
点赞
踩
60

收藏

觉得还不错? 一键收藏
2
评论
数据分析实战之决策树（泰坦尼克号乘客生存预测）

本文利用已给特征属性和存活与否标签的训练集和只包含特征信息测试集数据，通过决策树模型来预测测试集数据乘客的生存情况数据集来源为https://github.com/cystanford/Titanic_Data，可下载数据查看其各字段信息生存预测的流程：1、数据探索：import numpy as npimport pandas as pdtrain_data = pd...
复制链接

扫一扫