数据结构
Series结构
series是一种类似一维数组的结构,可以数据类型不同,类似原生python的列表
import pandas as pd
# 创建方式
# 方法一 (当index不填写时候以创建时下标位置作为索引)
s1 = pd.Series(data=[1,'a',5.4,9,"hello"],index=[x,y,z,....])
# 方法二 (使用字典,直接传值和索引)
#创建一个字典
sdata = {'Ohio': 3500, 'Texas': 72000, "Oregon": 16000, 'Utah': 5000}
s2 = pd.Series(sdata)
# 相关操作
# 输出 (以索引和数据作为一行输出)
print(s1)
# 查看索引
print(s1.index)
# 仅仅输出数据
print(s1.values)
# 输出索引对应的值 (一个索引可以只写一个[])
print(s1[[索引值1,索引值二]])
DataFrame结构
DataFrame是一种二维数组
import pandas as pd
# 创建方式
# 方法一 文件读取
# 查看pandas学习日记(一)
# 方法二 使用字典创建(字典中所有的值应该长度相同)
data = {
'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9]
}
df = pd.DataFrame(data)
# 输出各个字段类型
print(df.dtype)
# 输出字段
print(df.columns)
# 索引
print(df.index)
# 查询操作
# 列查询
# 单列
print(df["字段名"]) # df['字段名']实际上是返回的是Series类型的数据,用print(type(df['字段名'])可以查证)
# 多列
print(df[["字段1","字段2","字段3",...]]) #因为是多列 返回的还是DataFram类型
# 行查询
# 单行
print(df.loc[行号])
# 多行
print(df.loc[xxx]) # xxx 是指的可以使用和原生python一样的索引切片