比赛整理
比赛整理
xiaopihaierletian
这个作者很懒,什么都没留下…
展开
-
机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾
作者: 寒小阳 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49797143 声明:版权所有,转载请注明出处,谢谢。1.引言先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)!然后push自己抽出时间来写这篇blog的原因也非常简单:写完转载 2017-01-06 20:50:32 · 612 阅读 · 0 评论 -
Kaggle:数据践行者的好去处(如何开展大数据的实践?)
Kaggle:数据践行者的好去处(如何开展大数据的实践?)大数据的学习是需要实践的,因为学习的最有效方式之一就是通过实践(Learning by doing),只有把学习和实践结合起来才能达到最大的效果。那么大数据的学习如何进行实践呢?一个很好的途径就是利用目前流行的数据分析、竞赛平台。今天就来介绍一个,名字叫Kaggle。1、Kaggle是什么?Kaggl转载 2017-01-06 15:38:35 · 477 阅读 · 0 评论 -
Kaggle入门
由于选修了数据挖掘课程,课程作业是完成Kaggle上的一个比赛,所以在机缘巧合下就知道了Kaggle这个平台,事实上我认为这是用来练手数据挖掘的一个绝佳场所。这篇文章适合和我一样刚接触Kaggle的朋友,对于已经熟悉这个平台的朋友,欢迎指出我的错误,必定虚心受教。本文分为两个部分,第一部分简单介绍在上面完成比赛的流程,第二部分以手写数字识别为例子详细描述完成比赛的整个过程。1、Ka转载 2017-01-06 15:49:39 · 615 阅读 · 0 评论 -
一次失败的kaggle比赛Santander Customer Satisfaction:赛题简介与初次尝试
题目描述:https://www.kaggle.com/c/santander-customer-satisfaction简单总结:一堆匿名属性;label是0/1;目标是最大化AUC(ROC曲线下的面积)。第一次尝试:特征:由于比赛已经关闭,只能作为测试,我就直接用了暴力搜索提取较好的特征:[python] view原创 2017-04-17 09:03:40 · 2560 阅读 · 4 评论 -
一次失败的kaggle比赛(2):构造新特征、特征筛选
第一篇中提到的主要问题:第一:暴力搜索特征的方式在特征数较多的情况下不可取;较少的情况下可以考虑(第二:sklearn中的这几个模型,ExtraTreesClassifier效果最差,RandomForestClassifier效果较好且速度比较快,GradientBoostingClassifier结果最好但速度非常慢(因为不能并行)第三:当某一个模型(Gradi原创 2017-04-19 10:50:23 · 787 阅读 · 0 评论 -
一次失败的kaggle比赛(3):失败在什么地方,贪心筛选特征、交叉验证、blending
比赛结束了,结果可以看:https://www.kaggle.com/c/santander-customer-satisfaction/leaderboardpublic结果:private结果:首先对比private和public的结果,可以发现:1)几乎所有的人都overfitting了;原创 2017-04-19 10:56:03 · 1518 阅读 · 0 评论 -
记广东公共交通大数据竞赛—— 公交线路客流预测
——最终准确率 76.99% ——排名 83/2734 ——代码: https://github.com/francis7999/gd_line_pop_predict最后的成绩有欣慰也有不足,第一次参赛的我本该满足于前5%的排名,但想到参赛期间有一大半的天数都为其他的事情焦头烂额,没有做任何改进,总是不由感慨本可以取得更好的成绩。力学出身的我,此前从未想到研究生会去做转载 2017-04-20 22:28:06 · 1734 阅读 · 0 评论 -
【Kaggle——Liberty Mutual Group: Property Inspection Prediction】:如何刷入TOP-10
题目地址为https://www.kaggle.com/c/liberty-mutual-group-property-inspection-prediction这里先占个坑,描述大概思路,然后详细介绍怎么做这个比赛。并且承诺最后放出源码。首先是任务:In this challenge, your task is to predict a转载 2017-04-19 13:52:45 · 373 阅读 · 0 评论 -
基于时空信息的交通流量预测方法汇总
主要收集了基于时空(欧式与非欧空间)交通流量预测最新方法部分论文下载交通流量预测算法调研 算法名称 算法基本原理 考虑维度 应用场景 是否有开源实现 链接 实验数据集 期刊 基于时间图卷积网络(T-GCN)交通流预测(A Temporal Graph Convolutional Network for Traffic Prediction ) 一种基于神经网络的交通预测方法,该模型结合了图卷积网络(GCN)和门控递归单元(GRU)。GCN用于.原创 2020-09-23 11:12:09 · 4112 阅读 · 0 评论