自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 task3 对多模态分类的一点理解#Data Whale AI夏令营

在深入研究和实践机器学习模型的过程中,我们发现数据增强技术对于提升模型性能至关重要。数据增强技术通过模拟真实世界中的数据变化,为模型提供了更多的样本变体,这有助于模型学习到更加泛化和鲁棒的特征。

2024-07-20 21:46:57 1319

原创 task3 参数调优#Data Whale AI夏令营

接下来,我们还可以尝试不同的参数网格,或者使用其他类型的超参数优化技术,比如随机搜索或贝叶斯优化,来进一步改进模型。,这是一个强大的工具,它通过在给定的参数网格上进行交叉验证来搜索最优的参数组合。这样,你就不必手动调整参数,而是让算法自动完成这项工作,这不仅节省时间,而且可以提高找到更好参数组合的机会。原来的代码中,LightGBM模型的参数是硬编码的,这意味着在训练模型之前,需要手动设置这些参数。最后,我使用训练出的模型对验证集和测试集进行预测,并计算验证集上的均方误差(MSE),来评估模型的实际性能。

2024-07-20 21:33:22 184

原创 task2小记#Datawhale 多模态夏令营

构建CNN模型就像是搭积木。首先需要定义你的模型结构。这通常包括卷积层、池化层和全连接层。在PyTorch中,可以通过继承。

2024-07-17 21:21:38 1716

原创 机器学习task2的一点深入讨论#Datawhale AI 夏令营

只简单给出了不同type类型对应target的柱状图和id为00037f39cf的按dt为序列关于target的折线图,这只能分析出整个数据集的部分特征,对于模型选择的参考性有限,因此在原文档的基础上,我尝试进行了一些统计学数据分析,并进行更全面的数据集的特征的可视化来帮助我们进行模型选择。在原文档中,直接构建了历史平移特征和窗口统计特征,这存在一定的风险,因为:数据分析过程中,我们发现有一些房屋的用电量为负值,这显然是异常值,会对特征工程的构建产生负面影响。这些数据对于模型选择提供了一定的参考。

2024-07-15 23:39:19 1337

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除