一、数据的建立
import pandas as pd
from pandas import DataFrame
data = {
'ID' : ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
'name' : ['黎明', '赵怡春', '张富平', '白丽', '牛玉德', '姚华', '李南'],
'gender' : [True, False, True, False, True, False, True],
'age' : [16, 20, 18, 18, 17, 18, 16],
'height' : [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
}
frame = pd.DataFrame(data)
print(frame)
运行结果:
DataFrame会自动在每行记录前增加一个序号,这个被称为索引号(index)默认就是从0开始的整数。我们也可以在DataFrame变量创建时,再增加一个参数,给这个index参数强行设定为6到0,那么结果就会改变。
frame = pd.DataFrame(data, index = [6, 5, 4, 3, 2, 1, 0])
二、数据的选择
1. 列的显示
- 显示一个列:利用一个方括号直接,直接在里面写清楚列名称。
print(frame['name'])
- 简单形式:直接通过点加列名。但是这样写,当列名称正好和类里面的函数或者变量重名时,就会发生歧义。
print(frame.name)
- 显示多个列:前后加两个方括号,逗号分隔即可。这里的两个反括号有具体含义,其实frame后面的方括号只能放一个变量,因此需要再次使用方括号将两个字段名称括起来形成一个变量,表示列变量。
print(frame[['name', 'age']])
import pandas as pd
from pandas import DataFrame
data = {
'ID' : ['