Pandas中的数据类型
Pands中常用的数据类型有两者
- dataframe
- serise
Dataframe
这时一中数据表的形式,每一行有一个row label,每一列有一个column label
row label通常为数值类型,用来表示第几行(常以0开始)
cloumn label 通常为字符串类型,用来解释这一列的数据有什么用处
我们通常一行表示一条数据,一列表示这条数据的一个特征
所以,每一列通常为相同类型的数据,但是列与列之间可以是不同类型的数据
这里可以看出,dataframe数据类型可以由两部分组成
浅色部分是data,深色部分是label,又分为row label和 column label
label 类型实际上是一个index类型的数据
Series
series被称为序列,是一个一维的数据类型
series中由三个属性
- name : 表示序列的名称
- dtype : 表示序列中数据的数据类型
- index : 表示序列对应的索引
所以序列类型的数据类型包含两部分,左侧是索引,右侧是数据
在平时,我们经常用到reshape功能,但是在series类型中是不能使用reshape的,解决方法就是,用.values
来将序列转换成Numpy中的ndarray再进行reshape
两者关系
序列和数据框之间是密切关联的,当访问DataFrame的一行时,pandas自动把该行转换为序列;当访问DataFrame的一列时,Pandas也自动把该列转换为序列。