Kaggle比赛分类与winner资料汇总(更新中)
1.介绍
把比赛分为四类,Data Mining、Images、NLP、Speech Recognition,举几个例子:
- Data Mining:比如ctr预估、推荐,基本是不包括Deep Learning的比赛
- Images:图像类,Google AI Open Images - Object Detection Track
- NLP:自然语言处理类,Quora Question Pairs
- Speech Recognition:语音识别,TensorFlow Speech Recognition Challenge
本篇博客会介绍一些结束的比赛或者博主经历过的比赛,一开始会将比赛进行分类,介绍基本的任务,然后根据需要深入了解一些比赛后再更新前几名的solution、一些资料的链接、一些trick和分享一些心得等。
大致介绍一下接下来的结构,首先按照类别把比赛分进行分类,每一类里按照比赛的结束时间由最近的介绍到以前的。
目前更新到Plant Seedlings Classification
2.比赛
忽略的比赛有:
Flavours of Physics: Finding τ → μμμ (Kernels Only)
TrackML Particle Tracking Challenge
iNaturalist Challenge at FGVC5
Google Cloud & NCAA® ML Competition 2018-Men’s
Google Cloud & NCAA® ML Competition 2018-Women’s
2.1 Data Mining
2.1.1 分类(Classification)
Forest Cover Type (Kernels Only)
结束时间:2018-09-25 Playground
Multi-class Classification
1.任务介绍:根据森林的土壤、海拔等信息预测数的类型,accuracy计算得分。
What’s Cooking? (Kernels Only)
结束时间:2018-09-25 Playground
Multi-class Classification
1.任务介绍:根据烹饪中用的材料,预测它是哪个地区的烹饪方式,accuracy计算得分。
Costa Rican Household Poverty Level Prediction
结束时间:2018-09-18 Playground
Multi-class Classification
1.任务介绍:根据家庭情况,预测家庭的贫困等级,macro F1 score计算得分。
Home Credit Default Risk
结束时间:2018-08-29 Featured
Binary Classification
1.任务介绍:根据贷款申请者的情况判断是否通过其贷款申请,ROC area计算得分.
TalkingData AdTracking Fraud Detection Challenge
结束时间:2018-05-07 Featured
ctr, Predict probability
1.任务介绍:预测用户在点击移动应用广告后下载应用的概率,ROC area计算得分。
2.1.2 分类(综合)
Avito Demand Prediction Challenge
结束时间:2018-06-27 Featured
Predict probability
1.任务介绍:根据商品的信息(标题、图片、描述等)预测卖出去的概率,RMSE计算得分。
DonorsChoose.org Application Screening
结束时间:2018-04-25 Playground
Predict probability
1.任务介绍:根据项目描述的文本和项目的其他元数据预测被批准的概率,ROC area计算得分。
2.1.3 回归(Regression)
New York City Taxi Fare Prediction
结束时间:2018-09-25 Playground
- 任务介绍:根据上下车的地点预测纽约出租车的计费,大规模数据,RMSE 计算得分
Store Item Demand Forecasting Challenge
结束时间:2018-09-25 Playground
- 任务介绍:根据过去5年的商品销售数据,预测未来3个月的商品销售额,时间序列,SMAPE计算得分。
Santander Value Prediction Challenge
结束时间:2018-08-20 Featured
1.任务介绍:预测潜在客服的交易价值,RMSLE 计算得分。
2.2 Images
2.2.1 图像分类(Image Classification)
给定一张输入图像,图像分类任务旨在判断该图像所属类别。
The 2nd YouTube-8M Video Understanding Challenge
结束时间:2018-08-06 Featured
Multi-label Classification
1.任务介绍:给YouTube视频打标签,Global Average Precision计算得分。
Humpback Whale Identification Challenge
结束时间:2018-07-15 Playground
Multi-class Classification
1.任务介绍:根据鲸鱼的尾巴图片对鲸鱼分类,MAP@5计算得分。
iMaterialist Challenge (Fashion) at FGVC5
结束时间:2018-05-30 Research
Multi-label Classification
1.任务介绍:为每张时尚图片分配多个属性,Mean F1 score(micro-averaged)计算得分。
iMaterialist Challenge (Furniture) at FGVC5
结束时间:2018-05-30 Research
Multi-class Classification
1.任务介绍:对每张家具照片分类,每张图片只有一个标签,average error计算得分。
Google Landmark Recognition Challenge
结束时间:2018-05-29 Research
Multi-label Classification
1.任务介绍:对每张景点照片分配0/1/more地标标签,Global Average Precision (GAP) at k计算得分。
Google Landmark Retrieval Challenge
结束时间:2018-05-29 Research
图像检索
1.任务介绍:对于每个查询,检索包含相同地标(如果有的话)的所有数据库图像,mAP@100计算得分。
Plant Seedlings Classification
结束时间:2018-03-12 Playground
Multi-class Classification
1.任务介绍:对每张植物图片预测其物种类别,micro-averaged F1-score计算得分。
2.2.2 目标定位(Object Localization)
在图像分类的基础上,我们还想知道图像中的目标具体在图像的什么位置,通常是以包围盒的(bounding box)形式。
RSNA Pneumonia Detection Challenge
结束时间:2018-10-31 Featured
- 任务介绍:找到医学图像中肺炎的位置,用bounding box包围,IoU计算得分。
2.2.3 目标检测(Object Detection)
在目标定位中,通常只有一个或固定数目的目标,而目标检测更一般化,其图像中出现的目标种类和数目都不定。因此,目标检测是比目标定位更具挑战性的任务。
Google AI Open Images - Object Detection Track
结束时间:2018-08-30 Featured
1.任务介绍:识别图片中的物体,目标种类和数目不定,用bounding box包围,Mean Average Precision计算得分。
Google AI Open Images - Visual Relationship Track
结束时间:2018-08-30 Featured
1.任务介绍:识别带有关系的物体,mAP&recall计算得分。
2.2.4 语义分割(Semantic Segmentation)
语义分割是目标检测更进阶的任务,目标检测只需要框出每个目标的包围盒,语义分割需要进一步判断图像中哪些像素属于哪个目标。
TGS Salt Identification Challenge
结束时间:2018-10-17 Featured
- 任务介绍:在卫星地图上找出是盐的pixel,IoU计算得分。
CVPR 2018 WAD Video Segmentation Challenge
结束时间:2018-06-11 Research
1.任务介绍:在图片中分割出七种不同的移动的物体,IoU计算得分。
2018 Data Science Bowl
结束时间:2018-04-16 Featured
1.任务介绍:在细胞图片中找到细胞核的pixels,IoU计算得分。
2.3 NLP
2.3.1 情感分析(Sentiment Analysis)
Movie Review Sentiment Analysis (Kernels Only)
结束时间:2018-09-24 Playground
Multi-class Classification
1.任务介绍:为Rotten Tomatoes的影评进行情感分类,accuracy计算得分。
Toxic Comment Classification Challenge
结束时间:2018-03-20 Featured
Multi-headed Classification
1.任务介绍:建立一个multi-headed模型,检测出不同类型的毒性,如威胁,淫秽,侮辱和仇恨,对每一类预测概率,mean column-wise ROC AUC计算得分。
2.4 Speech Recognition
2.4.1 语音分类
Freesound General-Purpose Audio Tagging Challenge
结束时间:2018-07-31 Research
Multiclass Classification
1.任务介绍:对语音进行分类,MAP@3计算得分。