机器学习,深度学习电力需求预测#Datawhale AI 夏令营

task1

要求跑通baseline即可

  对于小白来说,通过跑通baseline,我熟悉了整个比赛的结果提交流程,明确了提交结果的格式,为后期学习指明了方向。

task 2

入门lightgbm ,开始特征工程

什么是特征工程?

特征工程(Feature Engineering)是机器学习和数据科学中的一个重要过程,它涉及使用领域知识、数据洞察和创造性来从原始数据中提取、选择、转换和创建特征,以更好地训练机器学习模型。特征工程的目的是提高模型的预测准确性、减少模型的过拟合、提高模型的泛化能力以及加快模型的训练速度。

特征工程通常包括以下几个步骤:

  1. 特征选择(Feature Selection)
    • 从原始数据集中选择最有用的特征。这有助于减少模型的复杂度,提高模型的训练速度和预测性能。
    • 常用的特征选择方法包括过滤法(如卡方检验、互信息)、包装法(如递归特征消除)和嵌入法(如基于树的特征选择)。
  2. 特征构造(Feature Construction/Creation)
    • 根据原始数据,通过组合、聚合或转换等方式创建新的特征。这通常需要领域知识和对数据集的深入理解。
    • 例如,在金融数据集中,可以通过计算收益率、波动率等统计指标来构造新的特征。
  3. 特征提取(Feature Extraction)
    • 从原始数据中自动提取高层次的特征。这通常涉及使用无监督学习算法(如PCA、LDA)或深度学习模型(如自编码器、卷积神经网络)来自动发现数据的结构。
    • 特征提取特别适用于处理高维数据或原始数据难以直接解释的情况。
  4. 特征缩放(Feature Scaling)
    • 将特征缩放到相同的尺度上,以避免某些特征在模型中占据主导地位。常用的缩放方法包括标准化(使数据的均值为0,标准差为1)和归一化(将数据缩放到0和1之间)。
  5. 特征编码(Feature Encoding)
    • 将非数值型特征(如类别型数据)转换为数值型特征,以便机器学习模型可以处理。常用的编码方法包括独热编码(One-Hot Encoding)、标签编码(Label Encoding)和二进制编码(Binary Encoding)。
  6. 特征降维(Feature Reduction)
    • 在不损失太多信息的前提下,减少特征的数量。这有助于减少模型的复杂度,提高训练速度,并可能提高模型的泛化能力。
    • 常用的降维方法包括主成分分析(PCA)、线性判别分析(LDA)和奇异值分解(SVD)。

特征工程是一个迭代的过程,通常需要多次尝试和验证才能找到最优的特征集。通过精细的特征工程,可以显著提高机器学习模型的性能。

运行过程中出现报错:TypeError: train() got an unexpected keyword argument ‘verbose_eval‘

通过查阅资料,发现是lighgbm包版本错误,卸载旧版本后,安装3.3.0版本即可解决。

task 3

尝试使用深度学习方案

什么是深度学习?

深度学习(Deep Learning, DL)是机器学习(Machine Learning, ML)领域中的一个重要分支,它通过学习样本数据的内在规律和表示层次,使得机器能够识别和理解诸如文字、图像和声音等复杂数据。深度学习以人工神经网络(Artificial Neural Networks, ANNs)为架构,通过多个处理层的深度网络对数据进行建模,从而实现对数据的自动学习和特征提取。

运行过程中报错No module named 'tensorflow'

通过安装tensorflow解决

首先打开cmd,然后使用pip命令(Python的包管理工具)来下载并安装TensorFlow库。输入pip install tensorflow(对于CPU版本)或pip install tensorflow-gpu(对于需要GPU加速的旧版本,但注意自TensorFlow 2.1起,GPU支持已合并到tensorflow包中),然后按回车键即可。安装完成后,TensorFlow库将被添加到Python环境中,通过导入TensorFlow并打印其版本来验证安装是否成功。

  • 13
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值