Kaggle-Titanic前三名方法总结

最新推荐文章于 2023-07-28 16:05:47 发布

当代女大学生

最新推荐文章于 2023-07-28 16:05:47 发布

阅读量173

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36895331/article/details/113472194

版权

第三名

a-data-science-framework-to-achieve-99-accuracy

进行了数据分析和处理画出了很多关系图列出了各种不同模型得到的预测结果使用超参数调整模型

具体步骤：

导包导数据
处理空值
删除一些特征
构建新特征
对一些特征编码
分割训练和测试数据
画出各种图来进行数据分析
model：
分训练集和测试集留出10%
比较各种方法在测试集上的效果可视化
！算抛硬币的准确率
定义树的函数得到准确率
计算混淆矩阵并画出
使用超参数调整模型（库中的函数）:
调参前的准确率和之后的对比
用特征选择调整模型（dizzy）

第二名

introduction-to-ensembling-stacking-in-python

基本没画图对数据的观察不是通过代码来实现的是观察好了再对特征进行操作

导包导数据
构建新特征
处理空值
手动分箱编码
丢弃一些特征
皮尔森相关的热图
生成模型
（后面的代码报错）

第一名

titanic-data-science-solutions

这个是理解起来最简单的数据分析的简单易懂有一定的图形选用简单的模型没有集成学习

导包导数据
观察数据
看不同特征的各个种类的存活占比
画图观察关系
构建特征手动分箱
处理空值
用不同的基本方法预测数据
选出最优方法

当代女大学生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Kaggle-Titanic前三名方法总结

第三名a-data-science-framework-to-achieve-99-accuracy进行了数据分析和处理画出了很多关系图列出了各种不同模型得到的预测结果使用超参数调整模型具体步骤：导包导数据处理空值删除一些特征构建新特征对一些特征编码分割训练和测试数据画出各种图来进行数据分析model：分训练集和测试集留出10% 比较各种方法在测试集上的效果可视化！算抛硬币的准确率定义树的函数得到准确...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。