pandas - 基本数据操作

最新推荐文章于 2024-02-06 23:01:28 发布

梦因you而美

最新推荐文章于 2024-02-06 23:01:28 发布

阅读量1.1k

点赞数

分类专栏：数据挖掘文章标签：索引操作内容操作排序基本数据操作 pandas

本文链接：https://blog.csdn.net/apollo_miracle/article/details/88388155

版权

数据挖掘专栏收录该内容

44 篇文章 4 订阅

订阅专栏

为了更好的理解这些基本操作，我们将读取一个真实的股票数据。

# 读取文件
data = pd.read_csv("./data/stock_day/stock_day.csv")

1 索引操作

Numpy当中我们已经讲过使用索引选取序列和切片选择，pandas也支持类似的操作，也可以直接使用列名、行名

称，甚至组合使用。

pandas的DataFrame的获取有三种形式

直接使用行列索引(先列后行)
结合loc或者iloc使用索引
使用ix组合索引

# 通过行列索引
data['open'][['2018-02-27']]

# 使用loc
# loc:只能指定行列索引的名字
data.loc['2018-02-27':'2018-02-22', 'open']

# 使用iloc
# 使用iloc可以通过索引的下标去获取
data.iloc[0:100, 0:2].head()

# 使用ix进行下表和名称组合做引
data.ix[0:10, ['open', 'close']]
# 相当于
data[['close', 'open', 'high']][0:3]

不支持的操作

# 错误
data[['2018-02-27']]['open']
# 错误
data[:1, :2]

2 对于内容的操作

# 直接修改原来的值
data['close'] = 1
# 或者
data.close = 1

3 排序

排序有两种形式，一种对于索引进行排序，一种对于内容进行排序

使用df.sort_values（默认是从小到大)
- 单个键进行排序
- 多个键进行排序

使用df.sort_index给索引进行排序

# 按照涨跌幅大小进行排序 , 使用ascending指定按照大小排序
data = data.sort_values(by='p_change', ascending=False)

# 按照两个键进行排序
data = data.sort_values(by=['open', 'high'])

# 对索引进行排序
data.sort_index()

梦因you而美

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas - 基本数据操作

为了更好的理解这些基本操作，我们将读取一个真实的股票数据。# 读取文件data = pd.read_csv("./data/stock_day/stock_day.csv")1 索引操作Numpy当中我们已经讲过使用索引选取序列和切片选择，pandas也支持类似的操作，也可以直接使用列名、行名称，甚至组合使用。pandas的DataFrame的获取有三种形式直接使...
复制链接

扫一扫