2.head()
**head()** 函数用于返回 DataFrame 中的前 n 行数据,默认为 5 行。
示例代码:
import polars as pl
df = pl.read_csv(‘data.csv’)
print(df.head())
3.filter()
**filter()** 函数用于根据指定的条件筛选 DataFrame 中的行数据。
示例代码:
import polars as pl
df = pl.read_csv(‘data.csv’)
filtered_df = df.filter(pl.col(‘age’) > 18)#找age大于18的数据
print(filtered_df)
4.select()
**select()** 函数用于选择 DataFrame 中的列数据。
示例代码:
import polars as pl
df = pl.read_csv(‘data.csv’)
selected_df = df.select([‘name’, ‘age’])#返回列名为name和age的列数据
print(selected_df)
5.groupby()
**groupby()** 函数用于对 DataFrame 中的数据进行分组,并对分组后的数据进行聚合操作。
示例代码:
import polars as pl
df = pl.read_csv(‘data.csv’)
grouped_df = df.groupby(‘gender’).agg({‘age’: [‘min’, ‘max’, ‘mean’], ‘salar