文章目录
概括:Numpy+Scipy+pandas+matplotlib
一.pandas:唯一值、值计数以及成员资格
- unique方法用于获取Series中的唯一值数组(去重数据后的数组)
- value_counts方法用于计算一个Series中各值的出现频率
- isin方法用于判断矢量化集合的成员资格,可用于选取Series中或者DataFrame中列中数据的子集
二.pandas:层次索引
- 在某一个方向拥有多个(两个及两个以上)索引级别
- 通过层次化索引,pandas能够以较低维度形式处理高纬度的数据
- 通过层次化索引,可以按照层次统计数据
- 层次索引包括Series层次索引和DataFrame层次索引
1.两种索引值
代码:
import numpy as np
from pandas import Series, DataFrame
import pandas as pd
data=Series([988.44,55656,6959,56564,1235],
index=[ #设置索引值
['2001','2001','2001','2002','2002'],
[u'苹果',u'香蕉',u'西瓜',u'苹果',u'西瓜']
])
data
结果:
2001 苹果 988.44
香蕉 55656.00
西瓜 6959.00
2002 苹果 56564.00
西瓜 1235.00
dtype: float64
2.层次化索引
代码:
import numpy as np
from pandas import Serie