pandas 语法与使用(一)
1. 概述
pandas 库中有两个最基本的数据类型:Series 和 DataFrame。
Series 数据类型表示一维数组,与 numpy 中的一维 array 类似,二者与 Python 中基本的数据结构 List 相近;DataFrame 数据类型代表二维的表格型数据结构,可理解为 Series 的容器。
pandas 库中的基本数据类型及含义如下表所示:
2. Series 类型
2.1 Series 的创建和选择
Series 是能够保存任何类型数据(整数、字符串、浮点数、Python 对象等)的一维标记数组,并且每个数据都有自己的索引。
在 pandas 库中仅由一组数据即可创建最简单的 Series。
例子1:
引入 pandas 库创建一个 Series 一维数组。
2.2 创建 Series 并定义索引
例子2:
注意: 必须 Series 内的元素需 一 一 对应,否则就会报错,抛出异常。
可只显示索引,直接 ’ Y.index ',即可。
例子3:
2.3 索引的选择
在 pandas 中,用户可通过索引的方式选择 Series 中的某个值。
-
选择 Series 中的某个值
例子4:
-
选择 Series 中的多个值
例子5:
-
选择 Series 中表达式的值
所有的比较符都适用(<、 >、 == 、!=)。
例子6:
2.4 Series 中的数据操作
除了可创建 与 选择 Series 外,还可对 Series 进行各种数据操作(加、减、乘及布尔运算等)。
例子7:
布尔运算,元素存在时返回 True ,反之返回 False。
2.5 Series 数组的数据操作
pandas 库可对 单个数组和多个数组 进行数据操作,包括:加法、乘法、自动补齐不同索引、缺失值表示。
例子8: