Kaggle竞赛,初级入门,泰坦尼克号

本文是关于Kaggle泰坦尼克号竞赛的初级入门教程,重点介绍了训练数据的探索和初步清洗。通过对数据的观察,发现'PassengerId', 'Age', 'SibSp'与'Survived'的相关性较低,而'Parch'有轻微相关性。数据清洗过程中,针对缺失值进行了处理,如使用插值填充'Age',并根据'Cabin'创建新特征。此外,删除了对预测影响较小的特征,并对'Fare'进行离散化处理,为后续机器学习模型的建立做准备。" 100061790,8730448,Zabbix自定义监控配置完全指南,"['zabbix', '监控配置', '自定义监控', '进程监控', '日志监控']
摘要由CSDN通过智能技术生成

Kaggle竞赛,初级入门,泰坦尼克号

kaggle泰坦尼克号

一、训练数据探索

1、观察数据维度

import pandas as pd
import pandas_profiling
from autoviz.AutoViz_Class import AutoViz_Class
data=pd.read_csv('.\\train.csv')

维度:‘PassengerId’, ‘Survived’, ‘Pclass’, ‘Name’, ‘Sex’, ‘Age’, ‘SibSp’,
‘Parch’, ‘Ticket’, ‘Fare’, ‘Cabin’, ‘Embarked’
survived,即为y变量,0为死,1为生。

report=pandas_profiling.ProfileReport(data)
report.to_file(output_file=(".\\census_report.html"))
#自动生成一段数据分析视图

总体分析如图所示
还可以显示各个字段的情况
还可以显示各个字段的情况例如这个PassengerId,乘客id,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值