目录
- 学习目标
- 记忆DataFrame的形状、行列索引名称获取等基本属性
- 应用
Series
和DataFrame
的索引进行切片获取 - 应用
sort_index
和sort_values
实现索引和值的排序
数据预处理
为了更好的理解这些基本操作,我们将读取一个真实的股票数据。
import pandas as pd
# 读取文件
data = pd.read_csv("./data/stock_day.csv")
# 删除一些列,让数据更简单些,再去做后面的操作
data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10","v_ma20"], axis=1)
data.head()
使用 drop 命令时 axis 的含义:
- axis == 1 时 表示将对应的列标签(们)沿着竖直的方向依次删掉
- axis == 0 时 表示将对应的行标签(们)沿着水平的方向依次删掉
1. 索引操作
Pandas支持使用索引选取序列和切片选择,也可以直接使用列名、行名称,甚至组合使用。
索引操作 | 索引方式 | 例子 |
---|---|---|
直接索引 |
先列后行,索引值 | data[“open”][“2018-02-27”] |
loc |
先行后列,索引值 | data.loc[“2018-02-27”:“2018-02-2 |