- 博客(4)
- 收藏
- 关注
原创 Day4 跟着Chatgpt学习特征工程部分代码(二)
本次比赛是采用每天的天气信息(风速,日照等)来预测风力发电站/光伏发电站的当日产能,天气信息明显是一种时间序列,特别是日照具有很强的日循环特征,如何让模型捕捉到这种时间序列特征?由于数量量较少,代码采用的是boosting tree系列模型,并没有采用LSTM等深度学习网络。Chatgpt给出了两种考虑时间信息,并且对普通boosting tree模型改动较小的方法。
2025-04-18 08:05:39
1850
原创 Day3 跟着Chatgpt学习特征工程部分代码(一)
由于本人是代码小白,比赛代码全部由ChatGPT生成,我只能跟着GPT慢慢学着看懂代码。本篇记录一下特征工程部分内的几个函数/方法。
2025-04-17 23:25:16
721
原创 Day2 决策树模型学习
一种像树结构的模型,核心内容就是信息熵。常用的例子就是苹果分类,可以通过不同特征,例如:颜色,大小,气味等分类,最终分出好苹果还是坏苹果。正如树一样,从root(根节点)出发,不断根据特征分类,分岔,最终到达叶节点,确定出苹果的好坏。然而,分类树的核心问题就在于特征选择的顺序,也就是先依据哪个特征来挑苹果,我们希望的是分岔的步骤越少肯定是越好,越高效,但如何达到这一目的?这就依靠下面的信息熵来解决这个问题。
2025-04-16 15:16:04
1693
原创 Day1 NetCDF 数据结构初次学习
NetCDF(Network Common Data Form)是一种面向科学领域(尤其是气象、海洋、地球科学)的,非常适合存储如下结构的数据:时间序列空间网格(经纬度)多变量、多层数据(如温度、风速、降水等)NetCDF文件后缀一般为.nc或.nc4,数据结构包含组(Groups)、维(Dimensions)、变量(Variables)和属性(Attributes)四种描述类型,都是类字典形式。
2025-04-14 18:52:46
1664
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人