pandas_profiling

github链接

pandas_profilingextends the pandas DataFrame with df.profile_report()for quick data analysis.
结果由以下部分组成

  • Type inference
  • Essentials: type, unique values, missing values
  • Quantile statistics 最小值, Q1, median, Q3, 最大值, range,四分位数
  • Descriptive statistics like mean, mode, standard deviation(标准差), sum, median absolute deviation, coefficient of variation(变异系数), kurtosis(峰度), skewness(偏态)
  • Most frequent values
  • Histogram
  • Correlations highlighting of highly correlated variables, Spearman, Pearson and Kendall matrices
  • Missing values matrix, count, heatmap and dendrogram of missing values
  • Text analysis learn about categories (Uppercase, Space), scripts (Latin, Cyrillic) and blocks (ASCII) of text data.
  • File and Image analysis extract file sizes, creation dates and dimensions and scan for truncated images or those containing EXIF information.

Example

API

from pandas_profiling import ProfileReport
profile=ProfileReport(df,title="")

防止过量计算

profile = ProfileReport(large_dataset, minimal=True)
profile.to_file("output.html")

Report界面也可以设置,详情参考github页面,Explore deeper

命令

pandas_profiling input_file output_file
参数之后再看 能看懂

保存Report

profile.to_file("your_report.html")

或者

# As a string
json_data = profile.to_json()

# As a file
profile.to_file("your_report.json")

数据类型

目前识别的数据类型

  • Boolean
  • Numerical
  • Date
  • Categorical
  • URL
  • Path
  • File
  • Image

更详细的看visdom

集成到pycharm

集成之后直接右击文件即可生成report.html
参考github

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值