当拿到一堆大数据后,可能常常会因为不知所措而感迷茫
下面是自己在遇到问题的时候总结的一些简单方法
以备后用
1.数据属性分析
info()、head()、describe()
1.info()展示储存信息,可以显示出DataFrame等结构中每一个列的行数、数据结构信息
2.head()默认显示前5行数据信息,可以让数据分析者大概了解整体的信息情况,但对于全局数据而言还是不够明显
3.describe()将数据进行聚合,得到count、mean、std、min、max等信息
2.频率、密度分析
distplot() [seaborn模块]
1.distplot,可以同时画出直方图和连续密度估计图
ps.如果单独画直方图,可以用hist()方法,密度则可以用kde()方法