![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Kaggle&Tianchi
青盏
这个作者很懒,什么都没留下…
展开
-
Titanic Xgboost版代码分析
代码来源 关于xbgboost的调参可参考这篇文章 或官网 流程如下: 1. 读取测试集,训练集 2. 根据相关性手动选取特征 3. 选取测试集 4. 填充缺失值 5. 处理非数字型数据 6. 训练算法 7. 存储数据# 引入import pandas as pdimport xgboost as xgbfrom sklearn.preprocessing i原创 2017-03-21 19:27:32 · 2051 阅读 · 2 评论 -
Titanic 多模型版 详解数据分析部分 机器学习初学者实战
来源于 图片见原英文 附带其他分析: 1、使用XGboost算法,没有分析特征,但是能够很快理解数据分析预测的整个流程,便于接下来看其他复杂notebook 2、features分析很是详细且容易理解 3、使用heatmap图分析各个特征的相关性,使用stacking多层模型算法 4、如果想了解Pairplot图的含义,这里有分析。哪些feature更容易区分预测,哪些feature间存原创 2017-03-28 17:09:57 · 2424 阅读 · 0 评论 -
开源-BDCI2018面向电信行业存量用户的智能套餐个性化匹配模型Top1解决方案和代码
来源本人经过作者同意,公布了:BDCI2018面向电信行业存量用户的智能套餐个性化匹配模型数据竞赛top1解决方案和代码。该方案利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。 (最终排名1/2546) 赛题介绍 1.赛题名称面向电信行业存量用户的...转载 2018-12-06 17:05:42 · 6070 阅读 · 1 评论 -
天池之江杯 视频识别&问答-SuperGUTS冠军-解决方案
来源 由于PPT上都是图,直接发打字比较好PPT那么多页其实也就几段字,哪有那么多东西讲 1. mp4关键帧I帧抽取,抽取I帧至40帧,不足则在I帧之间补足40帧 2. 2017vqa冠军的模型 faster rcnn (1) 抽取36个物体,受限于IO效率,物体和帧之间以帧为重 (2) attribute特征,把输出bbox的属性词作为特征,一是无...转载 2018-12-07 15:35:29 · 1824 阅读 · 0 评论 -
海康威视研究院ImageNet2016竞赛经验分享
来自目录场景分类数据增强数据增强对最后的识别性能和泛化能力都有着非常重要的作用。我们使用下面这些数据增强方法。第一,对颜色的数据增强,包括色彩的饱和度、亮度和对比度等方面,主要从Facebook的代码里改过来的。第二,PCA Jittering,最早是由Alex在他2012年赢得ImageNet竞赛的那篇NIPS中提出来的. 我们首先按照RGB三个颜色通道计算了均值和标准差,对网络的输入数...转载 2018-06-27 15:26:11 · 3574 阅读 · 0 评论 -
Kesci“魔镜杯”风控算法大赛复赛解决方案
来自 决赛答辩第4,获得铜奖代码地址:https://github.com/wepe/PPD_RiskControlCompetition转载 2018-06-27 15:34:15 · 618 阅读 · 0 评论 -
AI Challenger 2018:细粒度用户评论情感分析冠军思路总结
来源2018年8月-12月,由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐,冠军团队从来自全球81个国家、1000多所大学和公司的过万支参赛团队中脱颖而出。其中“后厂村静静”团队-由毕业于北京大学的程惠阁(现已入职美团点评)单人组队,勇夺“细粒度用户评论情感分类”赛道的冠军。本文系程惠阁对于本次参赛的思路总结和经验分享,希...转载 2019-02-06 00:29:02 · 9333 阅读 · 1 评论