Kaggle-Titanic前三名方法总结

第三名 

a-data-science-framework-to-achieve-99-accuracy

进行了数据分析和处理  画出了很多关系图  列出了各种不同模型得到的预测结果  使用超参数调整模型

具体步骤:

导包 导数据
处理空值
删除一些特征
构建新特征
对一些特征编码
分割训练和测试数据
画出各种图来进行数据分析
model:
      分训练集和测试集 留出10%
      比较各种方法在测试集上的效果 可视化
      !算抛硬币的准确率
      定义树的函数 得到准确率
      计算混淆矩阵并画出
      使用超参数调整模型(库中的函数):
             调参前的准确率 和 之后的对比
      用特征选择调整模型(dizzy)

 

第二名

introduction-to-ensembling-stacking-in-python

基本没画图 对数据的观察不是通过代码来实现的 是观察好了再对特征进行操作

导包 导数据
构建新特征
处理空值
手动分箱编码
丢弃一些特征
皮尔森相关的热图
生成模型 
(后面的代码报错)

 

第一名

titanic-data-science-solutions

这个是理解起来最简单的  数据分析的简单易懂  有一定的图形  选用简单的模型  没有集成学习

导包 导数据
观察数据
看不同特征的各个种类的存活占比
画图 观察关系
构建特征 手动分箱
处理空值
用不同的基本方法预测数据
选出最优方法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值