一、pandas的撒胡菊架构介绍
pandas有两个主要的数据结构:series和dataframe。它们是解决大部分应用可靠、易于使用的基础。
1.1 series
1.1.1series怎么使用?
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据即可产生最简单的Series:
概括: 给定一些数,用series会生成 一个索引(排列号),它是从0开始排序。
In [11]: obj = pd.Series([4, 7, -5, 3])
In [12]: obj
Out[12]:
0 4
1 7
2 -5
3 3
dtype: int64
1.1.2series中对数据的一些操作
1)看看index是啥
我们可以通过series的value和index属性获取其数组表示形式和索引对象
In [13]: obj.values
Out[13]: array([ 4, 7, -5, 3])
# values代表的是这个数组中的数值
In [14]: obj.index # like range(4)
#index是前面序列号的排序方式和数值
Out[14]: RangeIndex(start=0, stop=4, step=1)
2)怎么改变index对应的形式
我们可以自己来改变数据点的索引
In [15]: obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
In [16]: obj2
Out[16]:
d 4
b 7
a -5
c 3
dtype: int64
In [17]: obj2.index
Out[17]: Index(['d', 'b', 'a', 'c'], dtype='object')
3)调用series中的单个值
In [18]: obj2['a']
Out[18]: -5