python自学篇十六[pandas——数据分析 (四):唯一值+值计数+成员资格+层次索引+统计数据]

这篇博客介绍了使用pandas进行数据分析的一些关键操作,包括计算唯一值、值计数、成员资格检查,以及如何进行层次索引和基于层次索引的统计计算。此外,还涵盖了算法运算、数据对齐、函数应用和映射以及重置索引等概念。
摘要由CSDN通过智能技术生成

概括:Numpy+Scipy+pandas+matplotlib

在这里插入图片描述

一.pandas:唯一值、值计数以及成员资格

  • unique方法用于获取Series中的唯一值数组(去重数据后的数组)
  • value_counts方法用于计算一个Series中各值的出现频率
  • isin方法用于判断矢量化集合的成员资格,可用于选取Series中或者DataFrame中列中数据的子集

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二.pandas:层次索引

  • 在某一个方向拥有多个(两个及两个以上)索引级别
  • 通过层次化索引,pandas能够以较低维度形式处理高纬度的数据
  • 通过层次化索引,可以按照层次统计数据
  • 层次索引包括Series层次索引和DataFrame层次索引

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.两种索引值

代码:

import numpy as np
from pandas import Series, DataFrame
import pandas as pd
data=Series([988.44,55656,6959,56564,1235],
            index=[  #设置索引值
                ['2001','2001','2001','2002','2002'],
                [u'苹果',u'香蕉',u'西瓜',u'苹果',u'西瓜']
            ])
data

结果:

2001  苹果      988.44
      香蕉    55656.00
      西瓜     6959.00
2002  苹果    56564.00
      西瓜     1235.00
dtype: float64
2.层次化索引

代码:

import numpy as np
from pandas import Serie
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值