动手掌握数据分析Task1

最新推荐文章于 2023-12-09 09:23:11 发布

南楚巫妖

最新推荐文章于 2023-12-09 09:23:11 发布

阅读量231

点赞数

分类专栏：数据挖掘机器学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yingdajun/article/details/118712369

版权

机器学习方法同时被 2 个专栏收录

26 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

前言
今天是系统学习数据挖掘分析的Task1天。
该课程需要搭配joyful-pandas课程进行学习。
joyful-pandas的链接为：
https://gitee.com/panjoe/joyful-pandas?_from=gitee_search

目的
本课程的目的是通过参与kaggle的泰坦尼克号的比赛，掌握数据挖掘技术。
本课程的主要内容分为1.数据基础操作 2.数据清洗与重构 3.建模与评估

实验环境
本次博客是通过研究数据基础操作，实验环境是使用jupyter notebook环境，使用的包是numpy（1.18.2）、pandas(0.24.2)

实验步骤
1.载入库包
在这里插入图片描述
2.加载数据
将泰坦尼克号的数据加载进来

（1）分批读取

逐块读取应该是为了防止表格内容太大，容易占内存

（2）读取并修改表头
在这里插入图片描述
这里是为了方便大家理解与阅读
3.探索数据
（1）观察数据类型

（2）观察表格前5行的数据和后5行的数据

（3）判断数据是否为空，为空的地方返回True，其余地方返回False

4.数据保存

5.查看某列的所有值
在这里插入图片描述
6.筛选的逻辑
（1）我们以"Age"为筛选条件，显示年龄在10岁以下的乘客信息。

（2）以"Age"为条件，将年龄在10岁以上和50岁以下的乘客信息显示出来，并将这个数据命名为midage

（3）将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来。
在这里插入图片描述

7.进一步探索
（1）数据排序
对泰坦尼克号数据（trian.csv）按票价和年龄两列进行综合排序（降序排列）
在这里插入图片描述
（2）计算
通过泰坦尼克号数据如何计算出在船上最大的家族有多少人？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
动手掌握数据分析Task1

前言今天是系统学习数据挖掘分析的Task1天。该课程需要搭配joyful-pandas课程进行学习。joyful-pandas的链接为：https://gitee.com/panjoe/joyful-pandas?_from=gitee_search目的本课程的目的是通过参与kaggle的泰坦尼克号的比赛，掌握数据挖掘技术。本课程的主要内容分为1.数据基础操作 2.数据清洗与重构 3.建模与评估实验环境本次博客是通过研究数据基础操作，实验环境是使用jupyter notebook环境，使用
复制链接

扫一扫

专栏目录

博客等级

码龄8年

122
原创

116
点赞

376
收藏

190
粉丝

关注

私信

分类专栏

最新评论

cesium加载BIM模型
weixin_57642846: 加载出来为什么少东西不完整颜色啥的也不对啊
以前辅导学妹做的毕业设计
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。
以前辅导学妹做的毕业设计
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)起一个更符合文章内容的标题；(3)提升标题与正文的相关性。
使用matchzoo解决房产行业问答匹配比赛问题
qq_41887289: matchzoo是怎么给中文文本进行编码的？
cesium加载BIM模型
前端奥斯卡小金人: 请问是用什么软件转的fbx？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

南楚巫妖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。