Python骚操作：一行代码实现探索性数据分析

最新推荐文章于 2024-08-10 07:57:39 发布

程序媛-小糊涂

最新推荐文章于 2024-08-10 07:57:39 发布

阅读量362

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52216309/article/details/109673914

版权

使用Python库dataprep.eda进行数据探索性分析，该库能自动生成数据概览，包括列类型推断、时间单位选择、大量数据可视化。通过示例展示如何在泰坦尼克数据集上应用，一行代码实现数据分布可视化，揭示缺失值、列类型和标签不平衡等问题，指导后续数据预处理和特征选择。

摘要由CSDN通过智能技术生成

dataprep.eda
在使用数据前，我们首先要做的是观察数据，包括查看数据的类型、数据的范围、数据的分布等。dataprep.eda是个非常不错的工具，它可以帮你快速生成数据概览。dataprep.eda包含的一些智能特性：

为每个 EDA 任务选择正确的图形来可视化数据
列类型推断(数字型、类别型和日期时间型)
选择合适的时间单位（用户也可以指定）
对数量庞大的类型数据输出清晰的可视化方案（用户也可以指定）
dataprep安装
安装dataprep仅需要执行pip instal dataprep即可，由于依赖比较多，安装过程比较慢，需要耐心等待。
在这里插入图片描述
如果报错，多半是权限问题，可以在后面加上–user

实例
为了看到这一点的实际应用，我们将使用一个泰坦尼克数据集，我们从数据集的概述开始：

from dataprep.eda import *
import pandas as pd
train_df = pd.read_csv(‘titanic/train.csv’)
train_df

最低0.47元/天解锁文章

程序媛-小糊涂

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。