Polars学习笔记

最新推荐文章于 2024-05-06 09:41:28 发布

geniuscrh

最新推荐文章于 2024-05-06 09:41:28 发布

阅读量140

点赞数 1

文章标签： Polars

本文链接：https://blog.csdn.net/geniuscrh/article/details/137949137

版权

读取数据

#读取数据
dtype_dict={
    "count_date":pl.Utf8,
}
m_data= pl.read_csv(file_path,dtypes=dtype_dict,encoding="gbk")

# DataFrame转换
m_data=pl.from_pandas(m_data)

#选择列
m_data= m_data.select(["segm_id", "stand_name"])

数据转换

#格式转换
m_data= m_data.with_columns(
    pl.col('rank').cast(pl.Utf8)
)

#列名,重新命名
m_data= m_data.with_columns(
    pl.col('rank').alias("L7-rank")
)

关联

#Vlookup
m_data = m_data.join(m_other_data, left_on="left", right_on="right", how="left")

分析

分组编号

#整体排序
group=m_data.groupby(["L7"]).agg(
    pl.col("*"),
    pl.col("L7").cumcount().alias("rank"), 
)
#选择列
group=group.select(["L7","stand_name","rank"])
#展开
group=group.explode(["stand_name","rank"])
#合并
group = group.with_columns((pl.col('L7')+"-"+pl.col('rank').cast(pl.Utf8)).alias("L7-rank"))