概述
pandas包含两种数据结构,DataFrame和Series,分别表示二维数据结构和一维数据结构
Series
表示一维数据结构,也是包含两部分,左侧索引部分和右侧数据部分
一些常用的操作
Series的三种创建方式
# 方式一:通过数组创建Series
s1=pd.Series([1,2,3,'tom',True])
s1
# 方式二:创建指定索引列的Series
s2=pd.Series(['tom','jack','dane'],index=['001','002','003'])
s2
# 方式三:使用python字典创建Series
s3=pd.Series({'tom':'001','jack':'002'})
s3
Series的常见操作
# 获取s1的索引列
s1.index
# 获取s1的值
s1.values
# 使用下标获取某个值
s1[3]
# 查看数据类型
type(s1[3])
type(s1[0])
type(s1[4])
type(s1[[0,1]])
# 同时获取多个索引的val
s1[[0,1]]
DataFrame
表示二维数据结构,包含两部分,左侧索引部分和右侧数据部分
一些常用的操作
dataframe的创建方式
# 方式一:通过读取文件来创建(常用)
pd.read_csv()
pd.read_excel()
pd.read_sql()
# 方式二:通过字典来创建
data={
'id':[1,2,3],
'name':['tom','jack','dane']
}
df=pd.DataFrame(data)
df
dataframe的常见操作
# 获取数据类型
df.dtypes
# 获取columns
df.columns
# 获取索引列
df.index
# 获取某一列
df['id']
type(df['id'])#Series
# 获取多列
df[['name','id']]
type(df[['name','id']])#DataFrame
# 获取前n条数据
df.head(1)
# 获取后n条数据
df.tail(1)
# 获取某一条数据
df.loc[0]
type(df.loc[0])
# 获取多行数据
df.loc[1:2]
type(df.loc[0:1])
DataFrame和Series的转换关系
dataframe是二维的series是一维的,在数据处理的过程中,经常会遇到两种数据类型相互转换的情况
仅需记住一下规则即可区分数据类型是那种
如果仅一行或者一列数据,那么数据类型就是Series
如果多行或者多列,那么数据类型就是DataFrame