Python中用于数据探索的库主要是pandas(数据分析)和 Matplotlib(数据可视化),其中pandas提供了大量的与数据库探索相关的函数,这些数据探索函数壳大致分为统计特征函数与统计绘图函数,而绘图函数依赖于Matplotlib,所以往往又会跟Matplotlib结合在一起使用。
3.3.1 基本统计特征函数
统计特征函数用于计算数据的均值、方差、标准差、分位数、相关系数、协方差等。这些统计特征能反应出数据的整体分布。
![e94e42d2c8f7acb3d3c747c9d5894a4c.png](https://i-blog.csdnimg.cn/blog_migrate/dd859308c98306a3b84e4de2f0311a33.jpeg)
一些 :
![b0dfd100f1ee8ba3c29fd368b4e9c141.png](https://i-blog.csdnimg.cn/blog_migrate/ff521ba2001bacf1744e825ae72d6572.png)
![6b4c7283214718759227e39979a727f1.png](https://i-blog.csdnimg.cn/blog_migrate/b1b0dab84be62521071d8589e7f1e090.png)
![19d97ccbffec553e5e31b02caf9ee7fc.png](https://i-blog.csdnimg.cn/blog_migrate/94f2ada56809f57ea256b10a9afe0c09.jpeg)
3.3.2 拓展统计特征函数
除了上述基本统计特征外,pandas还提供了另外一些非常方便实用的计算统计特征的函数,主要有累积计算(cum)和滚动计算(pd.rolling),如下表:
![68cab6baa7e4c939495fad9a02ef2091.png](https://i-blog.csdnimg.cn/blog_migrate/b337e1840b1a8c4c09d9817972b5fd9c.png)
![e8db961a913662d06e44cd3ab5d83b60.png](https://i-blog.csdnimg.cn/blog_migrate/ad7f87b45bf06aafd8895f0df72c68be.jpeg)
:
![94f1f7154d7d51071e849cf238c64e1f.png](https://i-blog.csdnimg.cn/blog_migrate/e20857a8922bb8bfa4ffab95caac4477.png)
3.3.3 统计绘图函数
![898f17728a77979136eb73d0b4d2da45.png](https://i-blog.csdnimg.cn/blog_migrate/ace302466d4e621889ac7390feb9c7c0.jpeg)
1、plot
1)功能:绘制线性二维图,折线图
2)使用格式:plt.plot(x,y,S) # 字符"S"指定绘制时图形的类型、样式和颜色,常用的有"b"为蓝色、"r"为红色、"g"为绿色、"o"为圆圈、"+"为加号标记、"-"为实线、"--"为虚线
ps:D.plot(kind="box") # kind参数指定绘图类型,支持line(线)、bar(条形)、barh、hist(直方图)、box(箱线图)、kde(密度图)、area、pie(饼图)等。
3) :
![388d13fbc20a0fdd81d56b7838ae6361.png](https://i-blog.csdnimg.cn/blog_migrate/f17132e9262817e8757e1f074eaecb97.jpeg)
2、pie
1) 绘制饼图
2) 使用格式:plt.pie(size)
3) :
![7cae0d902bf46624f233551cdc040c94.png](https://i-blog.csdnimg.cn/blog_migrate/789fcd3d2cab8b3cc49b57a6379f6cea.jpeg)
3、hist
1) 功能:绘制二维条形直方图,可显示数据的分布情形
2) 使用格式:plt.hist(x,y)
3) :
![440cedfcf4e7b0ae7686bcc912625d50.png](https://i-blog.csdnimg.cn/blog_migrate/a026cbea44ac546d1ab31841e2f9b2b5.png)
4、boxplot
1)功能:绘制样本数据的箱型图
2) 使用格式:D.boxplot()/D.plot(kind="box")
3) :
![0e981976650431abb6b6ea162d176942.png](https://i-blog.csdnimg.cn/blog_migrate/59c763f405602800966d54916aac74f2.jpeg)
5、plot(logx=True)/plot(logy=True)
1) 功能:绘制x轴或y轴的对数图形
2) 使用格式: D.plot(logx=True)/D.plot(logy=True)
3) :
![fe15f1fa25a4809cc0c8ce74b71d67f8.png](https://i-blog.csdnimg.cn/blog_migrate/1eb80be93216f2858e53f85d26c85e02.jpeg)
![b71779e0a58721160ad14decfebbb996.png](https://i-blog.csdnimg.cn/blog_migrate/c6737ddf903e7968b94c49da6f706841.png)
6、plot(yerr=error)
1) 功能:绘制误差条形图
2) 使用格式:D.plot(yerr=error)
3) :
![f1dc7d9c3aab16c397d12414cee204fa.png](https://i-blog.csdnimg.cn/blog_migrate/95e7afed286694e29c8c9feb036778e5.png)
![0d2d5f0a4b2a7f873f81450bab08b36f.png](https://i-blog.csdnimg.cn/blog_migrate/70ff03e512e32d431fa031a1b65063c9.png)