sort_values() 是一个用于排序数据的 Pandas 函数,主要用于对 DataFrame 或 Series 中的值进行排序。以下是它的一般用法:
在 DataFrame 上的用法:
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, ignore_index=False)
在 Series 上的用法:
Series.sort_values(ascending=True, inplace=False, ignore_index=False)
参数说明:
by(DataFrame 上可用):指定按哪一列或多列的值来排序。可以是列标签的字符串或列标签的列表。
axis(DataFrame 上可用,可选):指定排序的轴,0 表示按行排序,1 表示按列排序。
ascending(可选):一个布尔值或布尔值的列表,用于指定升序还是降序排序。默认为升序(True)。
inplace(可选):一个布尔值,如果设置为 True,则会在原地修改 DataFrame 或 Series,而不是返回一个新的对象。默认为 False。
ignore_index(可选):一个布尔值,如果设置为 True,将重置排序后的结果的索引,使其按默认顺序排列。
示例:
在 DataFrame 上进行排序:
import pandas as pd
data = {'A': [3, 1, 2], 'B': [6, 4, 5]}
df = pd.DataFrame(data)
# 按列 'A' 的值升序排序
df.sort_values(by='A')
# 按列 'B' 的值降序排序
df.sort_values(by='B', ascending=False)
在 Series 上进行排序:
import pandas as pd
s = pd.Series([3, 1, 2, 4, 5])
# 升序排序
s.sort_values()
# 降序排序并重置索引
s.sort_values(ascending=False, ignore_index=True)
请注意,sort_values() 不会改变原始数据,而是返回一个排序后的新 DataFrame 或 Series(除非你将 inplace 参数设置为 True)。
这是 Pandas 中排序数据的基本方法,你可以根据你的需求来选择不同的参数来完成各种排序操作。