介绍
Pandas 是一个 Python 数据分析库,有许多有用的函数,可以轻松使用。 在本文中,将解释两个函数:df.rename() 和 df.where()。
df.rename()
df.rename() 用于更改数据框的列名(column name)或行名(index)。 下面的代码将 str.strip 函数应用于每个列名,以删除列名两端的空格字符。
df.rename(mapper=str.strip, axis='columns
这里,mapper=str.strip 将 str.strip 函数应用于每个列名称。 该函数用于删除字符串两端的空白字符。
axis=‘columns’ 指定 rename() 函数对列名称进行操作。
此操作格式化列名称,使数据分析和预处理更加容易。
df.where() 函数
df.where() 函数是根据条件选择数据框元素的函数。 与条件匹配的元素保持原样,不匹配的元素用 NaN 替换。
基本用法如下。
df.where(condition, other)
这里的条件是应用于数据框中元素的条件表达式。 匹配此条件的元素将原样复制到新数据框中。
other 是一个可选参数,指定要分配给不匹配条件的元素的值。 默认情况下使用 NaN。
下面的代码是仅检索 A 列值大于 3 的行的示例。
filtered_df = df.where(df['A'] > 3)
这使得有条件地选择和替换数据框中的元素变得容易。
这是 Pandas df.rename() 和 df.where() 函数的基本解释。 掌握这些功能将使您的数据分析更加高效。