![874cfc6b9505e290ae3823099c437340.png](https://i-blog.csdnimg.cn/blog_migrate/6b643bffcad0ba83feb30f81b866f64f.jpeg)
- pandas常用数据结构
- 数据获取与保存
- 数据筛选
一、常用数据结构(pandas是基于numpy的)
Series(序列)
- 由一组数据以及一组与之对应的数据标签(即索引)组成
- 可以通过pandas.Series来创建Series,每个Series可以看成式DataFrame的一个列
a、创建一个序列
import
![abe8b233391b34358eda4743200cca91.png](https://i-blog.csdnimg.cn/blog_migrate/401883d6d6b9cc1ec6575a820cd114dc.png)
![b9efd17feb422311a08cda162bb7b75c.png](https://i-blog.csdnimg.cn/blog_migrate/3ecf4fa918cf121d1bca1cd90b19474f.png)
注:上述参数中,index表示的是索引,必须与数据等长度,name代表对象名称
b、series常用属性
- value:返回Series对象所有元素
- index:返回索引
- dtypes:返回数据类型
- shape:返回series数据形状
- ndim:返回对象维度
- size:返回对象个数
import numpy as np
import pandas as pd
series = pd.Series({'北京':2.8,'上海':3.01,'广东':8.99,'江苏':8.59,'浙江':5.18})
print(series.values)
print(series.index)
print(series.index.values) # 输出的是array 索引
print(series.dtypes)
print(series.ndim)
print(series[0:3]) # python是左开右闭的,第四行元素是去不到的
print(series['北京']) # 输出北京的值
print(series['北京':'广东']) # 输出北京到广东