上一次我分享了 Numpy 的学习心得,没看过的朋友点这里 numpy
这次我们学习另一个非常重要的工具 Pandas,很多小伙伴可能已经听说过 pandas 了,pandas 是基于 numpy 构建的含有更高级数据结构和分析能力的工具包,功能更强大,我们趁热打铁,在学完上面的 Numpy 后把 pandas 学到手。
pandas 有两种数据结构:Series 和 DataFrme
Series 是个定长的字典序列,在存储的时候相当于两个 ndarray。Series有两个基本属性:index 和 values, index 默认是 0, 1, 2…,我们也可以自己指定比如:index = [‘a’, ‘b’, ‘c’, ‘d’]
import pandas as pd
from pandas import Series, DataFrame
a = Series([1, 2, 3, 4])
c = Series(data=(1, 2, 3, 4), index=['a', 'b', 'c', 'd'])
print(a)
print(c)
输出结果
0 1
1 2
2 3
3 4
dtype: int64
a 1
b 2
c 3
d 4
dtype: int64
我们也可以像创建字典一样创建 Series
f = {'a':1, 'b': 2, 'c': 3}
x1 = Series(f)
print(x1)
a 1
b 2
c 3
dtype: int64
DataFrame 包含了行索引和列索引,类似于数据库表。
期末了,我们虚构几个同学考试的场景,输出考试成绩。
import pandas as pd
from pandas import Series, DataFrame
data = {'Chinese': [