示例代码:
import polars as pl
df = pl.read_csv('data.csv')
2.head()
head() 函数用于返回 DataFrame 中的前 n 行数据,默认为 5 行。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
print(df.head())
3.filter()
filter() 函数用于根据指定的条件筛选 DataFrame 中的行数据。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
filtered_df = df.filter(pl.col('age') > 18)#找age大于18的数据
print(filtered_df)
4.select()
select() 函数用于选择 DataFrame 中的列数据。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
selected_df = df.select(['name', 'age'])#返回列名为name和age的列数据
print(selected_df)
5.groupby()
groupby() 函数用于对 DataFrame 中的数据进行分组,并对分组后的数据进行聚合操作。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
grouped_df = df.groupby('gender').agg({'age': ['min', 'max', 'mean'], 'salary': 'sum'})
print(grouped_df)
.agg() 是 Polars 库中用于对 DataFrame 进行聚合操作的函数。它可以接受一个字典参数,用于指定要聚合的列以及要使用的聚合函数。
- join()
join() 函数用于将两个 DataFrame 中的数据根据指定的列进行连接操作。
示例代码:
import polars as pl
df1 = pl.read_csv('data1.csv')
df2 = pl.read_csv('data2.csv')
joined_df = df1.join(df2, on='id')
print(joined_df)
7.sort()
sort() 函数用于根据指定的列对 DataFrame 中的数据进行排序操作。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
sorted_df = df.sort(by='age')
print(sorted_df)
8.fill_null()
fill_null() 函数用于将 DataFrame 中的空值填充为指定的值。
示例代码:
import polars as pl
df = pl.read_csv('data.csv')
filled_df = df.fill_null(0)#用0填充空值
print(filled_df)
9.describe()
describe() 函数用于生成 DataFrame 中的数值列的描述性统计信息,包括计数、平均数、标准差、最小值、最大值等。
(1)Python所有方向的学习路线(新版)
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python学习视频
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!