pandas-profiling(数据预览分析)

对于探索性数据分析来说,做数据分析前需要先看一下数据的总体概况,pandas_profiling工具可以快速预览数据。

1、pandas-profiling安装与调用

pip install pandas-profiling

import pandas as pd
import pandas_profiling

2、导入数据

data=pd.read_csv("model.csv")

 3、直接查看

pandas_profiling.ProfileReport(data)

4、数据概览

4.1总体数据

首先是数据集信息:

变量数(列)、观察数(行)、数据缺失率、内存;

数据类型的分布情况

4.2警告信息

主要包括以下信息:

  • 要点:类型,唯一值,缺失值
  • 分位数统计量,如最小值,Q1,中位数,Q3,最大值,范围,四分位数范围
  • 描述性统计数据,如均值,模式,标准差,总和,中位数绝对偏差,变异系数,峰度,偏度

4.3单变量描述 

以此对每个变量进行描述解析

4.4相关性分析

  • 相关性突出高度相关变量,Spearman和Pearson矩阵

5、生成HTML报告文件

profile = pandas_profiling.ProfileReport(data)
profile.to_file(outputfile = "output_file.html")

保存在默认文件夹,也可以自己指定路径。

  • 17
    点赞
  • 132
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 12
    评论
Pandas-profiling是一个用于快速生成数据报告的Python库。要安装pandas-profiling库,可以使用pip命令进行安装,如下所示:pip install pandas-profiling。如果在安装过程中遇到问题,可以尝试使用以下命令安装:pip install pandas-profiling -i https://pypi.tuna.tsinghua.edu.cn/simple。使用pandas-profiling库生成报告的基本用法如下:首先导入所需的库,然后创建一个包含随机数据数据框,接下来使用ProfileReport函数生成报告并保存为HTML文件。例如:import numpy as np import pandas as pd from pandas_profiling import ProfileReport df = pd.DataFrame( np.random.rand(100, 5), columns=["a", "b", "c", "d", "e"] ) profile = ProfileReport(df, title="Pandas Profiling Report") profile.to_file("your_report.html")除了基本用法,还可以使用其他参数进行自定义设置,例如使用minimal参数生成简化的报告,设置直方图的bin数等。更多使用方法请参考官方文档或引用中的代码示例。如果以上安装方法无法成功,还可以尝试使用以下命令安装:pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Python之pandas-profilingpandas-profiling库的简介、安装、使用方法之详细攻略](https://blog.csdn.net/qq_41185868/article/details/109710384)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *3* [一行代码生成数据分析报告—Pandas-profiling](https://blog.csdn.net/qq_32532663/article/details/108501727)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Andy_shenzl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值