大数据相关比赛
本专栏主要分享我参加的一些大数据比赛,目前有阿里天池大数据竞赛、京东jdata等,会一直更新我所参加的比赛哟~
光于前裕于后
本人有多年大数据与机器学习开发经验,并乐于总结与分享,如有侵权或写的不对的地方可以私信我,有问题也可以问我哟,free~
展开
-
天池新人实战赛——阿里移动推荐算法大赛(离线赛与平台赛)
竞赛题目 (离线赛与平台赛题目一样,只是数据量不一样,离线2000w+条数据,平台11亿+条数据)在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行为数据,往往还需要利用更丰富的用户行为数据。定义如下的符号:U——用户集合I——商品全集P——商品子集,P⊆ID——用户对商品全集的行为数据集合...原创 2016-04-13 17:04:23 · 14819 阅读 · 10 评论 -
机器学习入门——以阿里移动推荐算法大赛为例
从数据中学的模型的过程称为“学习”(learning)或“训练”(training),这个过程通过执行某个学习算法来完成,如GBDT。训练过程中使用的数据称为“训练数据”,其中的每个样本称为一个“训练样本”(training sample),训练样本组成的集合称为“训练集”(training set)。原创 2016-04-19 20:25:22 · 6109 阅读 · 1 评论 -
天池新人实战赛——阿里移动推荐算法大赛(御膳房、DTPAI、ODPS初体验)
几个名词:ODPS(OpenData Processing Service):开放数据处理服务由阿里云自主研发,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。DT(data technology):数据时代PAI(Platform of Artificial Intelligence):人工智能平台ODPS SQL:类似于SQL的语原创 2016-04-12 18:18:15 · 4473 阅读 · 0 评论 -
“联创黔线”杯大数据应用创新大赛
文章目录赛题介绍代码1 特征工程1.1 正样本1.2 负样本2 建模3 预测3.1 测试集4 提交结果0 查看数据0.1 训练数据0.1.1 正样本0.1.2 负样本0.1.3 天气数据0.2 测试数据0.2.1 测试集0.2.2 天气数据赛题地址:https://www.kesci.com/home/competition/5be92233954d6e001063649a又打了个酱油,最终成...原创 2019-07-31 18:59:12 · 2535 阅读 · 0 评论 -
2019JDATA用户对品类下店铺的购买预测(机器学习一般步骤总结)
文章目录赛题介绍建模流程1.查看分析数据2.数据清洗3.构造数据集(特征工程)4.特征选择5.模型选择6.参数选择7.模型训练与测试8.模型融合赛题介绍赛题网址:https://jdata.jd.com/html/detail.html?id=8赛题背景京东零售集团坚持“以信赖为基础、以客户为中心的价值创造”这一经营理念,在不同的消费场景和连接终端上,在正确的时间、正确的地点为3亿多活跃...原创 2019-05-26 16:52:20 · 5201 阅读 · 3 评论