Python训练营打卡DAY22

我想睡觉261

于 2025-05-11 15:32:59 发布

阅读量462

点赞数 12

分类专栏： python训练营60DAY打卡文章标签： python 机器学习开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2502_91094213/article/details/147871349

版权

python训练营60DAY打卡专栏收录该内容

22 篇文章

订阅专栏

DAY 22 复习日

复习日

仔细回顾一下之前21天的内容，补一下进度。

作业：

自行学习参考如何使用kaggle平台，写下使用注意点，并对下述比赛提交代码

kaggle泰坦里克号人员生还预测

代码：notebook69abf5cc79 --- notebook69abf5cc79

使用kaggle平台注意点：

挂梯子下载数据集更方便；仔细阅读介绍页看清数据以及提交方式方法内容。

复盘：

很粗糙的一次经历啊，由于kaggle数据集特点,数据降维很难继承到另一个无标签新数据集中，我只采用了数据筛选，但数据筛选效果很一般。其中Cabin特征中的值独热编码后两个数据集会产生维度以及名称上的不同，我无法处理这一情况只能把它删除，删除其实降了一些准确度的，但不删除又无法将训练好的模型代入训练无标签数据集。这种情况很想知道怎么能在保存足够多的特征同时又在两个数据集冲突下如何训练和处理数据。在模型方面大差不差，但调参优化感觉提升不大，也想知道有什么比较好的调参思路。这一次未使用聚类构造新特征带入训练看看精确度是否提升是个小遗憾，但它分为两个数据集，那要怎样使用聚类构造新特征，是不是有些麻烦。希望多多交流看看准确率更高的方法的优化提升思路吧。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。