泰坦尼克号python数据预处理_Python机器学习入门：泰坦尼克号预测

最新推荐文章于 2024-03-01 09:39:53 发布

weixin_39530838

最新推荐文章于 2024-03-01 09:39:53 发布

阅读量1.1k

点赞数

文章标签：泰坦尼克号python数据预处理

机器学习分析步骤：提出问题

2. 理解数据导入数据

采集数据

查看数据集信息

3. 数据清洗数据预处理

特征工程

4. 构建模型

5. 模型评估

6. 方案实施提交结果

报告撰写

一、提出问题

什么样的人可以在泰坦尼克号事故中生存下来

二、理解数据

① 导入数据(pd.read_csv)

先导入处理数据包Numpy和Pandas导入文件的时候注意应该用左划线(“/”)，而在文件中复制路径时是右划线D:\BaiduYunDownload

路径可以用双引号，也可以用单引号，结果是一样的

这里将泰坦尼克号数据中的train训练数据和test测试数据导入，测试数据集比训练数据集少1列，缺少的这些数据由接下来的机器学习进行计算。

② 数据合并(append)

因为train数据和test数据是分开进行导入的，为了方便进行数据清洗，先将两种数据进行合并

#数据1. append(#数据2，ignore_index=True)ignore_index默认为False，默认情况下会把添加的数据的索引行号保留下来，若ignore_index=Ture则会对所有的行重新自动建立索引。

③ 查看数据集信息(head()、describe()、info())

Age：年龄； Cabin：客舱号； Embarked&#

最低0.47元/天解锁文章

weixin_39530838

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
泰坦尼克号python数据预处理_Python机器学习入门：泰坦尼克号预测

机器学习分析步骤：提出问题2. 理解数据导入数据采集数据查看数据集信息3. 数据清洗数据预处理特征工程4. 构建模型5. 模型评估6. 方案实施提交结果报告撰写一、提出问题什么样的人可以在泰坦尼克号事故中生存下来二、理解数据① 导入数据(pd.read_csv)先导入处理数据包Numpy和Pandas导入文件的时候注意应该用左划线(“/”)，而在文件中复制路径时是右划线D:\BaiduYunDow...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。