Datawhale数据分析学习第一天

Precisionly

已于 2024-03-13 01:11:49 修改

阅读量479

点赞数 14

文章标签：数据分析学习数据挖掘

于 2024-03-13 01:11:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Precisionly/article/details/136666255

版权

本文介绍了通过三个步骤分析Titanic数据集的过程：首先，使用Pandas和Jupyter读取和初步观察数据；其次，对数据按票价和年龄排序；最后，应用sklearn库构建和评估模型。

摘要由CSDN通过智能技术生成

数据集下载地址https://www.kaggle.com/c/titanic/overview

整体课程分为三部分：

第一部分：我们获得一个要分析的数据，我要学会如何加载数据，查看数据，然后学习Pandas的一些基础操作，最后开始尝试探索性的数据分析。
第二部分：当我们可以比较熟练的操作数据并认识这个数据之后，我们需要开始数据清洗以及重构，将原始数据变为一个可用好用的数据，为之后放入模型做准备
第三部分：我们根据任务需求不同，要考虑建立什么模型，我们接触流行的sklearn库，建立模型。然后一个模型的好坏，我们是需要评估的，之后我们会引入模型评估的一些改变和实现。

首先对于数据进行初步的载入与观察，这里就用到了pandas库，我用jupyter进行展示：

这里我使用绝对路径载入数据

每1000行为一个数据模块，逐块读取

chunker = pd.read_csv('train.csv', chunksize=1000)

更改表头为中文

第二步：对泰坦尼克号数据（trian.csv）按票价和年龄两列进行综合排序（降序排列）

第三步：

查看DataFrame数据的每列的名称

查看‘客舱’这一列所有值：

关注

14
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
Datawhale数据分析学习第一天

数据集下载地址。
复制链接

扫一扫

Precisionly CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

173万+: 周排名

19万+: 总排名

1853: 访问

: 等级

85: 积分

38: 粉丝

55: 获赞

0: 评论

34: 收藏

私信

关注

热门文章

最新评论

Datawhale数据学习第二天打卡——数据清理
CSDN-Ada助手: 恭喜用户在Datawhale数据学习中坚持打卡，第三篇博客“数据清理”内容丰富，讲解详细。建议下一步可以尝试结合实际案例进行分析，加深读者对数据清理的理解。希望用户继续保持创作的热情，不断提升自己的写作水平，共同进步！祝愿您越来越好！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Datawhale数据分析学习第一天
CSDN-Ada助手: 恭喜你完成了第一天的数据分析学习！看到你分享了数据集下载地址，让人感到期待你接下来的学习分享。希望你能继续坚持下去，不断学习进步。除了数据集的下载，在数据分析中还有很多重要的工具和技能，比如数据清洗、数据可视化、数据建模等，希望你也能在后续的学习中逐步掌握并加以应用。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Hashmap的简单学习
CSDN-Ada助手: 恭喜你开始博客创作！标题“Hashmap的简单学习”听起来非常有趣。了解和掌握Hashmap是一个重要的里程碑，它是编程中常用的数据结构之一。我很期待你在博客中分享关于Hashmap的详细知识，并希望你能解释它的用途和实际应用场景。同时，我建议你在文章中提供一些实例代码，这样读者可以更好地理解Hashmap的工作原理。加油，期待你下一篇博客的发布！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。