前期准备
学习准备
- 安装了python及pip
- 安装jupyter notebook
- 入门了numpy
安装并引入pandas
CTRL+r并输入cmd打开命令提示符,输入以下命令进行安装
pip install pandas
安装成功后引入pandas
import pandas as pd
panda数据结构
Series
定义
类似numpy一维数组
s1 = pd.Series([5, 34, 23, 7, 11])
操作
获取元素及索引
直接输出s1,会输出s1元素的索引、元素和元素的种类
可以通过values属性获得Series所有的元素值
可以通过index属性获得Series所有元素的索引值
索引和切片操作
获取s1里索引为3的值
获取s1里索引从2到4的值
与数组不同之处:索引可以自己定义(标签索引),同时,默认的位置索引(从0开始的数字)仍然有效
但是使用标签索引的时候,进行切片操作时结束值是包含的
为了区分标签索引和位置索引,可以使用loc属性和iloc属性
使用标签索引
s1.loc["a"]
使用位置索引
s1.iloc[3]
还可以直接给Series传入字典进行创建
查看标签是否存在
根据条件筛选元素
可以使用逻辑运算符(&,|,~)
s2[(s2>5)&(s2<15)]