20_Pandas.DataFrame中Series行的随机洗牌

最新推荐文章于 2022-09-17 13:23:36 发布

饺子大人

最新推荐文章于 2022-09-17 13:23:36 发布

阅读量681

点赞数

分类专栏： Pandas 文章标签： python 机器学习

本文链接：https://blog.csdn.net/qq_18351157/article/details/106639023

版权

Pandas 专栏收录该内容

75 篇文章 117 订阅

订阅专栏

20_Pandas.DataFrame中Series行的随机洗牌

通过使用sample（）方法，可以随机重新排列（改组）pandas.DataFrame和pandas.Series的行。虽然还有许多其他方法，但是使用sample（）方法很方便，因为不需要导入其他模块。

以下面的数据为例。

import pandas as pd

df = pd.read_csv('./data/20/sample_pandas_normal.csv')
print(df)
#       name  age state  point
# 0    Alice   24    NY     64
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 3     Dave   68    TX     70
# 4    Ellen   24    CA     88
# 5    Frank   30    NY     57

该示例是pandas.DataFrame，但是也可以用类似的方式对pandas.Series进行洗牌。

请注意，sort_values（）和sort_index（）用于根据索引和列值对行进行无序排序。请参阅下面的文章。

17_pandas.DataFrame，Series排序（sort_values，sort_index）

sample（）方法指定参数frac = 1

有关sample（）方法的详细信息，请参见以下文章。

19_Pandas随机抽取行和列的样本（sample）

如果参数frac = 1，则意味着对所有行进行随机采样，这等效于对整个行进行随机重排（随机播放）。

df_s = df.sample(frac=1)
print(df_s)
#       name  age state  point
# 2  Charlie   18    CA     70
# 5    Frank   30    NY     57
# 4    Ellen   24    CA     88
# 1      Bob   42    CA     92
# 0    Alice   24    NY     64
# 3     Dave   68    TX     70

可以通过指定参数random_state来固定随机数种子。它们总是以相同的方式排序。

df_s = df.sample(frac=1, random_state=0)
print(df_s)
#       name  age state  point
# 5    Frank   30    NY     57
# 2  Charlie   18    CA     70
# 1      Bob   42    CA     92
# 3     Dave   68    TX     70
# 0    Alice   24    NY     64
# 4    Ellen   24    CA     88

使用reset_index（）方法重新分配索引（行号）

可以使用reset_index（）方法重新分配改组后的对象的索引（行号）。使用参数drop = True删除原始索引。

df_s = df.sample(frac=1).reset_index(drop=True)
print(df_s)
#       name  age state  point
# 0    Ellen   24    CA     88
# 1  Charlie   18    CA     70
# 2    Alice   24    NY     64
# 3     Dave   68    TX     70
# 4    Frank   30    NY     57
# 5      Bob   42    CA     92

更新原始对象

使用此方法，无法更改原始对象本身，因此，如果要更新原始对象，请将其分配给原始对象并覆盖它。

df = df.sample(frac=1).reset_index(drop=True)
print(df)
#       name  age state  point
# 0     Dave   68    TX     70
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 3    Alice   24    NY     64
# 4    Ellen   24    CA     88
# 5    Frank   30    NY     57

饺子大人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
20_Pandas.DataFrame中Series行的随机洗牌

20_Pandas.DataFrame中Series行的随机洗牌通过使用sample（）方法，可以随机重新排列（改组）pandas.DataFrame和pandas.Series的行。虽然还有许多其他方法，但是使用sample（）方法很方便，因为不需要导入其他模块。以下面的数据为例。import pandas as pddf = pd.read_csv('./data/20/sample_pandas_normal.csv')print(df)# name age state
复制链接

扫一扫