一、引用pandas库
import pandas as pd
data={'ID':['01','02','03'],
'name':['王明','李春','刘华'],
'gander':['男','女','女'],
'age':[16,20,18],
'height':[1.88,1.78,1.81]}
frame = pd.DataFrame(data)
print(frame)
> 输出:
——————> column axis=1
| ID name gander age height
| 0 01 王明 男 16 1.88
index 1 02 李春 女 20 1.78
2 03 刘华 女 18 1.81
axis=0
DataFrame是一个表格型数据类型,既有行索引(index),也有列索引(column)
二、选择数据
#选择行
print(frame[1:2]) #输出序号为1的行
#输出 ID name gander age height
# 1 02 李春 女 20 1.78
#注:frame[1] 是错误的
# print(frame[0:2:2]) 输出序号为 0 , 2 行
#选择列
print(frame['name'])
#输出 0 王明
# 1 李春
# 2 刘华
#选择多列 frame[['name','age']] 列表里只允许有一个值
#行列结合
print(frame['name'][1:2]) # 输出 1 李春
#['name'] 与 [1:2] 不分顺序
#使用loc函数,可以直接读取行、列和单元格 .loc[行, 列]
#行
print(frame.loc[1])
#输出ID 02
# name 李春
# gander 女
# age 20
# height 1.78
#单元格
print(frame.loc[1, 'name']) #中间用逗号隔开
# 输出 name
# 李春
#列
print(frame.loc[:, 'name'])
#输出 0 王明
# 1 李春
# 2 刘华
#使用iloc函数,它完全采用序号来访问行和列,比如 iloc[1,2] 表示第2行和第三列
print(frame.iloc[0:1, 2])
#输出 0 男
# 1 女
print(frame[[0,2], [0,1]])
#输出 ID name
# 0 01 王明
# 2 03 刘华
# 加条件
print(frame[frame['age'] > 17])
# 输出 ID name gander age height
# 1 02 李春 女 20 1.78
# 2 03 刘华 女 18 1.81
print(frame['name'][[1,2]][(frame['height'] > 1.80)])
#输出 2 刘华