2.13 描述性统计(平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差))...

统计分析包括描述统计和推断统计两个部分。

对已有的数据整理,计算数据指标,平均数,中位数,中数,数据的离散度(极差,平均绝对偏差,方差标准差)是最常用的技术手段,也是最容易的。

# hanbb
# come on!!!
import tushare as ts
import matplotlib.pyplot as plt

# 股票数据获取
data_zglt = ts.get_hist_data('600050',start='2015-06-23',end='2017-11-16')
data_pfyh = ts.get_hist_data('600000',start='2015-06-23',end='2017-11-16')

# 收益率计算
data_zglt['returns'] = (data_zglt['close']-data_zglt['close'].shift(1))/data_zglt['close'].shift(1)
data_pfyh['returns'] = (data_pfyh['close']-data_pfyh['close'].shift(1))/data_pfyh['close'].shift(1)

# 求平均值
print(data_zglt['returns'].mean(),data_pfyh['returns'].mean())
# 求中位数
print(data_zglt["returns"].median(),data_pfyh["returns"].median())
# 求众数
print(data_zglt["returns"].mode(),data_pfyh["returns"].mode())

# 四分位数
print(data_zglt['returns'].quantile(i) for i in [0.25,0.75])
print(data_pfyh['returns'].quantile(i) for i in [0.25,0.75])


# 数据的离散度 稳定性
# 极差
print(data_zglt['returns'].max()-data_zglt['returns'].min())
print(data_pfyh['returns'].max()-data_pfyh['returns'].min())

# 平均绝对偏差(MAD:mean absolute devation)
# define:数据和均值差值的 之和 的平均数(除以N)
print(data_zglt["returns"].mad(),data_pfyh["returns"].mad())

# 方差(variance)和标准差(standard deviation)
# var define:数据和均值差值的 平方之和 的平均数(除以N-1)
print(data_zglt["returns"].var(),data_pfyh["returns"].var())
print(data_zglt["returns"].std(),data_pfyh["returns"].std())

# 描述性数据
print(data_zglt["returns"].describe(),data_pfyh["returns"].describe())

 

转载于:https://www.cnblogs.com/hanbb/p/8031216.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值