python中用于数据探索的库主要是pandas和matplotlib。pandas提供了大量的与数据探索相关的函数,这些数据探索函数大致分为统计特征函数与统计作图函数,而作图函数依赖于maplotlib,所以往往又跟Matplotlib结合一起使用
基本统计特征函数
统计特征函数用于计算数据的均值,方差,标准差,分位数,相关系数和协方差等,这些统计特征能反映出数据的整体分布。
具体使用格式可以百度出来,需要哪个百度哪个,溜得很
除了以上基本统计特征外,pandas还提供了一些非常方便实用的计算统计特征的函数,主要有累积计算(cum)和滚动计算(pd.rolling_)具体百度查看
统计作图函数
通过统计作图函数绘制达的图表可以直观地反映出数据及统计量的性质及其内在规律。python的主要作图库是Matplotlib
一般通过plt.show()来显示作图结果,具体格式百度查看就够了