import pandas as pd
# DataFrame是Pandas 中最常用的数据结构,它可以包含多个列,每一列可以是不同的数据类型,可将其看作电子表格、SQL表或 Series 对象的字典
# 创建
data = {'a': [1,2,3,4],
'b': [5,6,7,8],
'c': [9,10,11,12]}
df = pd.DataFrame(data)
print(df)
# 默认行索引是从0开始的正整数,也可以指定行索引
df1 = pd.DataFrame(data, columns=['a', 'b', 'c'],index=[11,12,13,14])
print(df1)
# 索引
# 可通过行索引对数据进行选取:
print(df1.loc[12])
print(df1.iloc[2])
# 采用类似 dict 的方式按列选取、设置和删除数据
print(df1['c'])
print(df1.c)
df1['c'] = df1['c'] + 1
print(df1['c'])
del df1['c']
print(df1)
# 通过布尔值选取
# 选取df1中a属性大于2的记录
print(df[df['a'] > 2])
dataframe基本操作
最新推荐文章于 2024-03-31 19:10:28 发布