一、数据的选择
1.列的选择
(1)选择列也称为字段
# coding:utf-8
'''
@Function: 2.2数据的选择
@Author :王育红
@Time : 2020/8/23
'''
import pandas as pd
from pandas import DataFrame
data = {
'Id': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
'name': ['黎明', '孙菁', '王煜希', '马天宇', '易烊千玺', '杨颖', '郑凯'],
'gender': [True, False, False, True, True, False, True],
'age': [38, 23, 23, 36, 24, 27, 26],
'height': [1.88, 1.67, 1.83, 1.80, 1.78, 1.66, 1.86]
}
frame = pd.DataFrame(data) # 索引可自行设置{,index=[0,1,2,3,4,5,6]},这里默认是0~6
#(第一种方法)
print(frame['name'])
#(第二种方法)
#print(frame.name)
查看运行结果:
(2)选择多个列,需要注意的是选择多个列要用两个中括号来表示
frame = pd.DataFrame(data)
# 这里选择了三个列
print(frame[['name','age','height']])
2.行的选择
# 行的选择,通过序列
print(frame[0:1]) # 通过范围来表示
print('============================================')
print(frame[1:7:2]) # 每两个取一个,一直到6
- 查看运行结果:
3.结合行和列的选择
print(frame[1:2]['name']) # 表示第二条记录的学生姓名
- 查看运行结果:
4.运用函数来选择查询
(1)loc函数的运用
(1.1)loc函数行的选择
# 直接读取行列,表示第一行
print(frame.loc[1])
print('===============================================')
# 通过冒号选择多个连续的行
print(frame.loc[1:3])
print('===============================================')
# 表示1 3行
print(frame.loc[[1, 3]])
print('==================================================')
# 通过逗号选择不连续的函数,选择第一和第三行
print(frame.loc[[1, 3]])
- 查看运行结果:
(1.2)利用loc函数表示列的选择查询
# 利用函数表示列
print(frame.loc[:, ['name']]) # 只选择查询姓名
print('===============================')
print(frame.loc[:, ['name', 'age']]) # 多个列的查询
print('================================')
# 任意选择行中的列,这里表示第3行到第5行的姓名,身高
print(frame.loc[0:5,