baseline 代码个人理解及学习笔记

该文介绍了机器学习的基础流程,包括数据处理、模型训练、预测和评估。重点在于使用LightGBM针对每个标签训练模型,并提取时间统计特征。文章通过计算MAE(平均绝对误差)来评估模型性能,并警告了过度训练的可能性。时间特征提取函数被应用于训练集和验证集,以增强模型的预测能力。
摘要由CSDN通过智能技术生成

1. baseline代码展示了机器学习的基础流程:数据处理->模型训练->预测->评估。重点是用 LightGBM 对每个标签分别训练模型,并做了时间统计特征的提取。

  • pred_labels 代表需要预测的标签列表,也就是模型要预测的目标变量。
  • train_set 代表训练集数据,会传入时间特征提取函数进行处理,然后作为模型的训练数据。
  • valid_set 代表验证集数据,也会经过时间特征处理。然后valid_set中的真实标签值valid_labels会与模型在valid_set上的预测结果valid_pred进行对比,计算MAE评分

2. 部分代码的理解

1)初始化评分项。创建一个字典 MAE_scores 来存储每个预测标签的 MAE 值。

  • MAE是评估指标,评估模型拟合的优劣。

2)特征工程。定义了一个时间特征提取函数 time_feature,用来从时间数据中提取统计特征。分别对训练集和测试集应用这个函数。

3)循环训练模型。遍历每个预测标签,提取对应标签的训练数据,使用 LightGBM 训练模型。并对验证集进行预测计算 MAE。注意:当循环迭代的次数过大的时候会出现“过拟合”的问题。

 baseline 代码文件地址:AI夏令营 - ML实践教程 - Feishu Docs

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值