2018/9/15
报名了Titanic竞赛。该竞赛被标记为Knowledge,纯入门之用,无奖金。
下载了data后,尝试用最基础的DTR拟合,失败。原因在于特征’Age’有空缺值,DTR不能接受。
根据竞赛页面的指导,找到了一个speedml包及相应的解。
不过在那之前,我首先参考https://blog.csdn.net/u013115001/article/details/78012553的指导,做一遍入门练习。
第一步,对缺失值和字符值做处理。参考pandas简介和匿名函数lambda。
第二步,把DTR改为DTC以获得离散值。并把median()改为mean(),得到了更好一点的分数0.73684。与原文的分数不同,推测可能是data更新了。
Kaggle Titanic竞赛日志(不定时更新)
最新推荐文章于 2020-03-23 12:01:44 发布