分析一个问题,从对样本进行探索开始。Python中有很多常用的数据分析函数,可以帮助我们对样本有一个初步的认识,比如describe()函数,可以很方便地生成每个变量的最大值、最小值、分位数等。
今天给大家介绍一个特别牛逼的函数,一行代码就能实现原始数据集的概览分析,进而可以保存成html报告。接下来揭开这个神奇函数的面纱吧。如果想看效果,可跳过第一部分的安装库教程。
文章目录
一、安装pandas_profiling库
1 方法一:pip install 安装
有些小伙伴直接在cmd中运行 pip install pandas_profiling 就可以成功安装这个库。那真的该恭喜你了。我的运行会报如下错误:
所以我准备直接下载whl文件进行安装。
2 方法二:whl文件安装
首先到如下网站下