从 Pandas 到 Polars 四十:使用Polars进行机器学习预处理(二)

我认为在未来一年里,我们会看到一个围绕Polars开发的优秀的机器学习预处理库。最近对该库的更新使得这个过程中的一个重要步骤变得更加容易……

填充一些空值

在机器学习预处理中,一个常见的步骤是将训练集的数据与测试集共享。例如,我们可能想用训练集中的值来填充测试集中的空值。

Polars中新的with_context方法正是这样做的。它允许你在一个数据框中使用另一个数据框的表达式!

在下面的示例中,我们在“Age”列中有一些空值。

(
    test_df
    .with_context(
        # 将训练列重命名以避免列名冲突
        train_df.select(pl.all().name.suffix("_train"))
    )
    # 使用训练集中的中位数填充测试集中的空值
    .with_column(
        pl.col("Age").fill_null(pl.col("Age_train").median())
    )    
)

我们想要用训练集中的中位数来替换测试集中的空值。

我们通过在测试数据框上调用with_context来将训练数据框带入上下文中。然后我们就可以填充一些空值了!

保持惰性

with_context的优势在于我们仍然保持在Polars中强大的惰性模式下,因此我们仍然可以利用诸如查询优化之类的功能。

实际上,我们总是在惰性模式下使用with_context,因为这就是Polars将查询的不同部分组合在一起的方式。

    往期热门文章:

从 Pandas 到 Polars 二十六:在Polars中,不要遍历列

从 Pandas 到 Polars 二十三:如果你的数据已经排序,Polars可以为你提供助力

从 Pandas 到 Polars 十八:数据科学 2025,对未来几年内数据科学领域发展的预测或展望

从 Pandas 到 Polars 十三:流式处理的关键参数

从 Pandas 到 Polars 十:“Polars 表达式“是什么?

从 Pandas 到 Polars 六:在 Polars 中流式处理大型数据集

从 Pandas 到 Polars 0:理解Polars嵌套列类型

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
自动控制节水灌溉技术的高低代表着农业现代化的发展状况,灌溉系统自动化水平较低是制约我国高效农业发展的主要原因。本文就此问题研究了单片机控制的滴灌节水灌溉系统,该系统可对不同土壤的湿度进行监控,并按照作物对土壤湿度的要求进行适时、适量灌水,其核心是单片机和PC机构成的控制部分,主要对土壤湿度与灌水量之间的关系、灌溉控制技术及设备系统的硬件、软件编程各个部分进行了深入的研究。 单片机控制部分采用上下位机的形式。下位机硬件部分选用AT89C51单片机为核心,主要由土壤湿度传感器,信号处理电路,显示电路,输出控制电路,故障报警电路等组成,软件选用汇编语言编程。上位机选用586型以上PC机,通过MAX232芯片实现同下位机的电平转换功能,上下位机之间通过串行通信方式进行数据的双向传输,软件选用VB高级编程语言以建立友好的人机界面。系统主要具有以下功能:可在PC机提供的人机对话界面上设置作物要求的土壤湿度相关参数;单片机可将土壤湿度传感器检测到的土壤湿度模拟量转换成数字量,显示于LED显示器上,同时单片机可采用串行通信方式将此湿度值传输到PC机上;PC机通过其内设程序计算出所需的灌水量和灌水时间,且显示于界面上,并将有关的灌水信息反馈给单片机,若需灌水,则单片机系统启动鸣音报警,发出灌水信号,并经放大驱动设备,开启电磁阀进行倒计时定时灌水,若不需灌水,即PC机上显示的灌水量和灌水时间均为0,系统不进行灌水。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值