NumPy 数组
pandas 主要是 DataFrame,它是用于实现表格化,面向列,使用行列标签的数据结构。
数据结构
元组:是一种固定长度,不可变的Python对象序列。用 () 定义元组
tuple_1=(4,5,6)
tuple_2=((4,),(4,5),6)
元组的元素可以是元组,字符串等等以及他们的组合
列表:长度可变,包含的内容也可以修改。用 [ ] 或list函数定义列表。与元组非常类似。
字典:拥有灵活尺寸的键值对集合,其中键、值都是Python对象。采用{}创建字典
d1={‘a’:‘some value’,‘b’:’[1,2,3,4]}
集合:是一种无序且元素为一的容器。通过set函数或用字面值集与大括号的语法。
set([2,3,4,2,3])
变成了{2,3,4}
pandas的数据结构:
Series:一维的数组型对象,包含了一个值序列,并且包含了数据标签,称为索引(index)
DataFrame:表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值,字符串,布尔值等)。既有行索引也有列索引,可以被视为一个共享相同索引的Series的字典。在DataFrame中数据被存储为一个以上的二维块,而不是列表、字典或其他一维数组的集合。