使用Titanic 数据集进行数据清洗，并使用ID3决策树与IPOT模型对乘客生存进行预测

最新推荐文章于 2024-04-05 13:47:54 发布

努努Hao

最新推荐文章于 2024-04-05 13:47:54 发布

阅读量533

点赞数 1

分类专栏：机器学习文章标签：决策树数据分析

本文链接：https://blog.csdn.net/Chowzheng/article/details/106960357

版权

1. 数据清洗

代码部分

import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.feature_extraction import DictVectorizer
from sklearn.model_selection import cross_val_score
from sklearn import metrics
from sklearn.feature_extraction import DictVectorizer

# 数据加载
train_data = pd.read_csv('./train.csv')
test_data = pd.read_csv('./test.csv')
# 数据探索
# 查看train_data信息
#pd.set_option('display.max_columns', None) #显示所有列
print('查看数据信息：列名、非空个数、类型等')
print(train_data.info())
print('-'*30)
print('查看数据摘要')
print(train_data.describe())
print

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努努Hao

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
使用Titanic 数据集进行数据清洗，并使用ID3决策树与IPOT模型对乘客生存进行预测

1. 数据清洗代码部分import numpy as npimport pandas as pdfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.model_selection import cross_val_scorefrom sklearn import metricsfrom sklearn.feature_e
复制链接

扫一扫