天池比赛：工业蒸汽量预测

最新推荐文章于 2024-07-07 21:28:34 发布

日常敲代码间歇旅行的程序媛

最新推荐文章于 2024-07-07 21:28:34 发布

阅读量526

点赞数

分类专栏：比赛文章标签：天池比赛

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41079550/article/details/103013645

版权

比赛专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了作者参加天池比赛时，针对工业蒸汽量预测的建模过程。通过去除异常特征、数据预处理、特征选择及模型训练，包括SVR、KRR、LGBM等，实现了模型性能提升。后续计划继续优化特征提取策略。

摘要由CSDN通过智能技术生成

https://tianchi.aliyun.com/competition/entrance/231693/introduction

偶然看到一句话：最重要的是提特征，特征决定上限，模型只是无限逼近上限。

版本记录：

1. result-11.6-v1.txt---------svr, KRR2, lgbm 0.115

2. result-11.11-v1.txt ---------svr, KRR2, lgbm, nn 0.115

3. result-11.11-v2.txt---------svr, KRR2, line, lasso ？

4. result-11.13-v4.txt--------- 0.1514

5. result-11.13-v3.txt---------0.85

代码如下：

1、2、3代码为：https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.3f9274ff5jgjLC&postId=60069

4代码为：https://blog.csdn.net/Soft_Po/article/details/90291908

5代码为：https://blog.csdn.net/yili_sha11/article/details/99999795

0.115模型流程：

1. 导入训练集、测试集

2.去掉异常特征"V5", "V9", "V11", "V17", "V22", "V28"（测试集和训练集特征分布不同）

3.归一化之最小最大值标准化-MinMaxScaler，所有值归一化为0到1

4.V0、V1、V6、V7、V8取值变成exp(x)，V30取值变成log1p

5.数据集的标准化，scaled之后的数据零均值，单位方差

6.计算数据偏度（？？？）

7.特征选择。方差选择法，先要计算各个特征的方差，然后根据阈值，选择方差大于阈值的特征。

https://blog.csdn.net/weixin_39938915/article/details/83040594

8. 选择最佳的18个特征。特征选择之SelectKBest: 返回k个最佳特征。

9. 构建svr, line, lasso, ENet, KRR1, KRR2, lgbm, xgb, nn模型进行训练。

10.模型集成。

接下来思路：在上边代码的基础上按照1st提供的思路调整特征提取方式。

1. 原始svr, KRR2, line, lasso上的结果： 0.1280 (0.0224) 测试集上0.1172

2. svr, KRR2, line, lasso+去掉相关度小的特征结果：0.1280 (0.0224)

3. svr, KRR2, lgbm, nn+去掉相关度小的特征结果：0.1237 (0.0258)

4.

日常敲代码间歇旅行的程序媛

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

日常敲代码间歇旅行的程序媛 CSDN认证博客专家 CSDN认证企业博客

码龄7年

45: 原创

10万+: 周排名

216万+: 总排名

7万+: 访问

: 等级

1120: 积分

23: 粉丝

47: 获赞

10: 评论

161: 收藏

私信

关注

热门文章

分类专栏

牛客刷题 2篇
比赛 1篇
词向量 1篇
Java初学技巧
Java 2篇
linux 13篇
NLP 11篇
python 15篇
tensorflow 2篇
知识图谱 1篇
cv 1篇
人工智能 2篇

最新评论

python同目录下模块的导入失败问题
InsaneGe: https://github.com/wangleihitcs/CaptionMetrics 我也是在跑这个项目遇见这个问题，好巧这是一个关于 Python 模块导入的问题。Python 有两种导入方式，绝对导入和相对导入。绝对导入是指从根目录开始，完整地指定模块的路径，比如 from mypkg import bleu_scorer。相对导入是指从当前模块的位置开始，用点号表示上级目录的层数，比如 from . import bleu_scorer 表示从当前目录导入 bleu_scorer 模块，from .. import mypkg 表示从上级目录导入 mypkg 包。 Python 2 和 Python 3 在处理相对导入的方式上有一些不同。Python 2 允许隐式的相对导入，也就是说，可以省略点号，直接写 from bleu_scorer import BleuScorer。但这样会造成一些歧义，比如如果当前目录下没有 bleu_scorer 模块，而系统路径中有一个同名的模块，那么 Python 2 会优先导入系统路径中的模块，而不是报错。Python 3 为了避免这种情况，规定了必须使用显式的相对导入，也就是说，必须加上点号，明确表示相对于当前目录的层级关系。所以，如果你的代码是在 Python 3 中运行的，那么你必须把 from bleu_scorer import BleuScorer 改成 from .bleu_scorer import BleuScorer，这样才能正确地导入当前目录下的 bleu_scorer 模块。如果你的代码是在 Python 2 中运行的，那么你可以不用改，但为了兼容性和清晰性，最好还是加上点号，表明这是一个相对导入。
python同目录下模块的导入失败问题
qq_46014962: 谢谢！记录一下，如果是同级文件夹，可以使用上一级。例如src.xxx
python同目录下模块的导入失败问题
creacentblue: thx bro！
一文读懂知识图谱
程序媛-承哥: 做预测和nlp的时候，这个概念是很值得学习的。
中文词向量大全
mz_老张: 这个好用吗？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。