python自动数据分析——pandas_profiling

最新推荐文章于 2024-04-25 09:33:18 发布

二哥不像程序员

最新推荐文章于 2024-04-25 09:33:18 发布

阅读量3.3k

点赞数 2

分类专栏：走进数据分析文章标签： python 数据分析报告 pandas_profiling

本文链接：https://blog.csdn.net/qq_35164554/article/details/102620544

版权

走进数据分析专栏收录该内容

7 篇文章 1 订阅

订阅专栏

pandas_profiling

我们常用pandas中的df.describe()函数去描述数据的情况，但是不能够直观的去展示出数据的分布情况，今天要介绍的这个工具pandas_profiling就是扩展了pandas中的DataFrame并且能自动进行数据分析并生成分析报告的库。

在分析过程中会得到下面的结果：

要点：类型，唯一值，缺失值
分位数统计信息，例如最小值，Q1，中位数，Q3，最大值，范围，四分位数范围
描述性统计数据，例如平均值，众数，标准偏差，总和，中位数绝对偏差，变异系数，峰度，偏度
最常使用的值
直方图
高相关变量Spearman，Pearson和Kendall矩阵的相关性突出显示
缺失值矩阵，计数，热图和缺失值树状图

废话少说，上实例：

import pandas as pd
import pandas_profiling

data = pd.read_csv('https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv')
data.profile_report(title='Auto Titanic Report')
profile = data.profile_report(title='Titanic Report') 
profile.to_file(output_file='titanic_report.html')

结果如下（输出成html格式这里给出截图）：

是不是很高大上！

官方文档地址：https://github.com/pandas-profiling/pandas-profiling

二哥不像程序员

关注

2
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
1
评论
python自动数据分析——pandas_profiling

pandas_profiling我们常用pandas中的df.describe()函数去描述数据的情况，但是不能够直观的去展示出数据的分布情况，今天要介绍的这个工具pandas_profiling就是扩展了pandas中的DataFrame并且能自动进行数据分析并生成分析报告的库。在分析过程中会得到下面的结果：要点：类型，唯一值，缺失值分位数统计信息，例如最小值，Q1，中位数，Q3...
复制链接

扫一扫