kaggle泰坦尼克实例学习笔记

最新推荐文章于 2023-03-19 18:34:14 发布

Bobby_test

最新推荐文章于 2023-03-19 18:34:14 发布

阅读量829

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Bobby_world/article/details/79220072

版权

一、内容介绍：

这一实例要求如下，在失事的泰坦上面，有若干乘客，公司有这些乘客的基本信息，比如年龄，性别等。

泰坦虽然沉了，但是仍然有乘客得以逃生，题目将所有乘客分为两类（活下来的以及失事的），给出了另外一项数据就是此人存活与否。

实例要求我们，根据这次事件的乘客数据和存活数据进行分析预测，判断接下来给出的四百多名乘客能否存活。

这里主要记录大致流程，仅作为个人学习笔记。

二、工具材料需求：

使用以下工具：

python及以下模块：

pandas、numpy、matplotlib、scikit-learn

其余数据材料取自kaggle

三、流程说明：

1.读取历史数据：

这一步使用pandas实现，如pandas.read_csv("...路径...")

2.观察、分析历史数据：

使用matploylib画图，对数据有一个感官上的认识，每次可以提取自己认为有关联的数据，进行绘图，多使用mean、sum等函数，从而对数据有多方面的认识。

3.数据处理：

对混乱的数据进行整理，比如，将文字信息数字化（人为定义），将散乱的数字信息（最大最小跨度比较大的数）归一化

4.训练历史数据：

数据处理完了以后，会显得整洁很多，此时就可以进行训练了，scikit-learn能够胜任训练工作。训练结束得到模型A。

5.处理测试数据：

待测试数据同样是混乱的，我们需要对其进行类似前面的处理，操作基本相同。

6.开始预测：

使用前面训练出的模型A对测试数据进行预测。任务完成。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kaggle泰坦尼克实例学习笔记

一、内容介绍：这一实例要求如下，在失事的泰坦上面，有若干乘客，公司有这些乘客的基本信息，比如年龄，性别等。泰坦虽然沉了，但是仍然有乘客得以逃生，题目将所有乘客分为两类（活下来的以及失事的），给出了另外一项数据就是此人存活与否。实例要求我们，根据这次事件的乘客数据和存活数据进行分析预测，判断接下来给出的四百多名乘客能否存活。
复制链接

扫一扫

Bobby_test CSDN认证博客专家 CSDN认证企业博客

码龄8年

11: 原创

137万+: 周排名

177万+: 总排名

2万+: 访问

: 等级

365: 积分

2: 粉丝

4: 获赞

2: 评论

20: 收藏

私信

关注

热门文章

最新评论

优化：4数平方和之积转换为2数平方之和
Bobby_test: 最终耗时13ms
优化：4数平方和之积转换为2数平方之和
Bobby_test: 啊，感觉自己好蠢，其实可以就直接拿他给的两个数去试，如果满足条件，就放进vector里面，不满足就扔掉，不用一个一个地遍历，太复杂了。我重写了一份，限于字数，就放一部分吧。 if(left<right){ long target1=sqrt(temp-left*left); if(target1-int(target1)==0){ lvec.push_back(make_pair(left,target1)); } long target2=sqrt(temp-right*right); if(target2-int(target2)==0){ lvec.push_back(make_pair(right,target2)); } }

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。