导入包
import pandas as pd
import pandas_profiling
生成报告
pandas_profiling.ProfileReport(data)
导出报告
prf = pandas_profiling.ProfileReport(data)
prf.to_file('report.html')
报告详细内容
1. 总缆
首先是总览 Overview,包含数据集的一些信息:
- 行数
- 列数
- 数据缺失率
- 占用内存大小
- 属性值的类型的统计
- 一些警报信息
2. 属性值描述
包含每个属性列的一些详细信息:
3. 属性值相关性分析