pandas - 统计分析

学习目标

  1. 使用describe完成综合统计
  2. 使用max完成最大值计算
  3. 使用min完成最小值计算
  4. 使用mean完成平均值计算
  5. 使用std完成标准差计算
  6. 使用idxmin、idxmax完成最大值最小值的索引
  7. 使用cumsum等实现累计分析

1 基本统计分析函数

1.1 综合分析: describe()

# 计算平均值、标准差、最大值、最小值、分位数
data.describe()

1.2 单个函数分析

countNumber of non-NA observations
sumSum of values
meanMean of values
madMean absolute deviation
medianArithmetic median of values
minMinimum
maxMaximum
modeMode
absAbsolute Value
prodProduct of values
stdBessel-corrected sample standard deviation
varUnbiased variance
idxmaxcompute the index labels with the maximum
idxmincompute the index labels with the minimum

对于单个函数去进行统计的时候,坐标轴还是按照这些默认“index” (axis=0, default), “columns” (axis=1)指定

# 单独计算
data['close'].max()

# 对所有的列进行计算
data.max(0)
# 对所有的行进行计算
data.max(1)

# 求出最大值的位置
data.idxmax(axis=0)

# 求出最小值的位置
data.idxmin(axis=0)

2 累计统计分析函数

函数作用
cumsum计算前1/2/3/…/n个数的和
cummax计算前1/2/3/…/n个数的最大值
cummin计算前1/2/3/…/n个数的最小值
cumprod计算前1/2/3/…/n个数的积

那么这些累计统计函数怎么用?

以上这些函数可以对series和dataframe操作

# 排序之后,进行累计求和
data = data.sort_index()

#计算累计函数
stock_rise = data['p_change']

# plot方法集成了前面直方图、条形图、饼图、折线图
stock_rise.cumsum()

那么如何让这个连续求和的结果更好的显示呢?

如果要使用plot函数,需要导入matplotlib

import matplotlib.pyplot as plt

stock_rise.cumsum().plot()
plt.show()

关于plot: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.plot.html?highlight=plot#pandas.DataFrame.plot

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值