自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Day4 跟着Chatgpt学习特征工程部分代码(二)

本次比赛是采用每天的天气信息(风速,日照等)来预测风力发电站/光伏发电站的当日产能,天气信息明显是一种时间序列,特别是日照具有很强的日循环特征,如何让模型捕捉到这种时间序列特征?由于数量量较少,代码采用的是boosting tree系列模型,并没有采用LSTM等深度学习网络。Chatgpt给出了两种考虑时间信息,并且对普通boosting tree模型改动较小的方法。

2025-04-18 08:05:39 1850

原创 Day3 跟着Chatgpt学习特征工程部分代码(一)

由于本人是代码小白,比赛代码全部由ChatGPT生成,我只能跟着GPT慢慢学着看懂代码。本篇记录一下特征工程部分内的几个函数/方法。

2025-04-17 23:25:16 721

原创 Day2 决策树模型学习

一种像树结构的模型,核心内容就是信息熵。常用的例子就是苹果分类,可以通过不同特征,例如:颜色,大小,气味等分类,最终分出好苹果还是坏苹果。正如树一样,从root(根节点)出发,不断根据特征分类,分岔,最终到达叶节点,确定出苹果的好坏。然而,分类树的核心问题就在于特征选择的顺序,也就是先依据哪个特征来挑苹果,我们希望的是分岔的步骤越少肯定是越好,越高效,但如何达到这一目的?这就依靠下面的信息熵来解决这个问题。

2025-04-16 15:16:04 1693

原创 Day1 NetCDF 数据结构初次学习

NetCDF(Network Common Data Form)是一种面向科学领域(尤其是气象、海洋、地球科学)的,非常适合存储如下结构的数据:时间序列空间网格(经纬度)多变量、多层数据(如温度、风速、降水等)NetCDF文件后缀一般为.nc或.nc4,数据结构包含组(Groups)、维(Dimensions)、变量(Variables)和属性(Attributes)四种描述类型,都是类字典形式。

2025-04-14 18:52:46 1664 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除