Python之Pandas库

Series 一组数据与之相关的数据索引组成,索引从0开始

pd.Series([9,8,7,6])

从标量值创建
pd.Series(25,index=[‘a’,’b’])//index不能省略,每一项都是25

从字典类型创建
pd.Series({‘a’:9,’b’:1}) pd.Series({‘a’:9,’b’:1},index=[‘c’,’a’])//这里index只是从字典中进行选择,没有的显示NaN,比如索引c对应NaN

从ndarray创建

pd.Series(np.arange(5),index=np.arange(9,4,-1))//数据从0到5,index省略时为0-5,这里索引是9到5,步长1

排序

a=pd.DataFrame(np.arange(20).reshape(4,5),index=[‘a’,’b’,’c’,’d’])

a.sort_values(2,ascending=False)//第2轴,就是第三列,降序 NaN统一放到末尾

基本的统计分析函数

a.describe()

数据的累积分析

.cummsum()//每个元素都是此位置加上上一行同位置元素之和
.cumprod()//每个元素都是此位置与上一行同位置元素之乘积
.cummin()//每个元素都是此列最小值
.cummiax()//每个元素都是此列最大值

滚动计算

.rolling(w).sum() //依次计算相邻w个元素(纵着看)的和

.rolling(w).mean()

.rolling(w).var()//方差

.rolling(w).std()//标准差

.rolling(w).min()

.rolling(w).max()

数据的相关分析 (两个事物正相关、负相关、不相关)

可以用协方差来判断

Pearson相关系数,【-1,1】

.cov()//计算协方差矩阵

.corr()//计算相关系数矩阵,Pearson等系数

例如,a.corr(b)就可以得到一个[-1,1]范围的Pearson系数值

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值