Python主要数据探索函数

@Python主要数据探索函数

基本统计特征函数

pandas包中DataFrame或者Series

普通公式
d.sum() …sum可变化成mean var std corr cov skew kurt described
拓展统计公式
d.cumsum() 累计求和 cumpod 累计求积 cummax 前n个最大的数字
rolling_sum(n)每n个数字求和,sum同样可变化成普通个数的
统计作图
plot hist pie boxplot 误差线图 对数图

#作图前
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.figure(figsize=(7,5))
#作图后
plt.show()

#plot,默认使用index作为x轴,每列数据作为纵轴
plt.plot(x,y,S)
#或者d为pandas的DataFrame或者Series对象时候
d.plot(kind='box')
import numpy as np
x=np.linspace(0,2*np.pi,50)
y=np.sin(x)
plt.plot(x, y,'bp--')#图形为蓝色带星虚线,显示正弦曲线

#饼图
labels='Frogs','Hogs','Dogs','Logs'
sizes=[15,30,45,30]
colors=['yellow','green','gold','lightcoral']
explode=(0,0.1,0,0)#突出显示第二块
plt.pie(sizes,explode=explode,labels=labels,colors=colors,autopct='%1.1f%%',shadow=True,startangle=90)
plt.axis('equal')#避免把圆压缩成椭圆
plt.show()

import numpy as np
x=np.random.randn(1000)
plt.hist(x,10)
plt.show()


#boxplot
import pandas as pd
x=np.random.randn(1000)
D=pd.DataFrame([x,x+1]).T
D.plot(kind='box')
plt.show()

#直接对数图
x=pd.Series(np.exp(np.arange(20)))
x.plot(label=u'原始数据', legend=True)
x=plot(logy=True,label=u'对数数据图',legend=True)

#plot(yerr=error)#D代表均值数据列,而error是误差列。yerr在y轴上绘制误差棒图,xerr在x轴上绘制误差棒图

error=np.random.randn(10)
y=pd.Series(np.sin(np.arange(10)))
y.plot(yerr=error)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值