一行代码搞定数据探索性分析(EDA)
查看名为 data 的 dataframe 里面字段分布情况,并输出为 df_profile.html
大家可以准备一个名为data 的 dataframe 运行一下这个代码看看,
其中有data 中各字段分布、缺失值占比、平均值、最大值、最小值等等,下图有其中一个字段的输出结果
import pandas as pd
import pandas_profiling
# 数据集data的EDA过程
pfr = pandas_profiling.ProfileReport(data)
#输出结果为html
pfr.to_file("/data/tmp/df_profile.html")