数据竞赛实操
木水_
这个作者很懒,什么都没留下…
展开
-
Kaggle:House Prices: Advanced Regression Techniques 数据预处理
本博客是博主在学习了两篇关于 “House Prices: Advanced Regression Techniques” 的教程 (House Prices EDA 和 Comprehensive data exploration with Python )后的总结,重点在于探究如何分析真实数据的分布以及如何对数据进行预处理,同时强化 pandas 和 seaborn 包的操作技巧。 ...原创 2018-06-01 15:13:03 · 3374 阅读 · 2 评论 -
Kaggle:Home Credit Default Risk 特征工程构建及可视化(2)
博主在之前的博客 Kaggle:Home Credit Default Risk 数据探索及可视化(1) 中介绍了 Home Credit Default Risk 竞赛中一个优秀 kernel 关于数据的探索及可视化的工作,本篇博客将围绕如何构建特征工程展开叙述,原文链接地址:Start Here: A Gentle Introduction1 简介 特征工程是指一个基因过程,可以...翻译 2018-06-30 16:28:26 · 3350 阅读 · 2 评论 -
Kaggle:Home Credit Default Risk 数据探索及可视化(1)
1 数据介绍 数据由Home Credit提供,该服务致力于向无银行账户的人群提供信贷(贷款)。预测客户是否偿还贷款或遇到困难是一项重要的业务需求,Home Credit将在Kaggle上举办此类竞赛,以了解机器学习社区可以开展哪些模式以帮助他们完成此任务。 有7种不同的数据来源: application_train / application_test:主要的培训和测试数据以及关于Home...翻译 2018-06-27 20:38:04 · 9631 阅读 · 5 评论 -
Kesci: Keras 实现 LSTM——时间序列预测
博主之前参与的一个科研项目是用 LSTM 结合 Attention 机制依据作物生长期内气象环境因素预测作物产量。本篇博客将介绍如何用 keras 深度学习的框架搭建 LSTM 模型对时间序列做预测。所用项目和数据集来自:真实业界数据的时间序列预测挑战。1 项目简单介绍1.1 背景介绍本项目的目标是建立内部与外部特征结合的多时序协同预测系统。数据集采用来自业界多组相关时间序列(约40组)与...原创 2018-07-04 16:36:32 · 7889 阅读 · 15 评论