ML&DL-项目类
Zero-One-0101
小菜鸟一枚,正在成长中!
展开
-
kaggle(01)-泰坦尼克号问题
经典又兼具备趣味性的Kaggle案例泰坦尼克号问题大家都熟悉的『Jack and Rose』的故事,豪华游艇倒了,大家都惊恐逃生,可是救生艇的数量有限,无法人人都有,副船长发话了『lady and kid first!』,所以是否获救其实并非随机,而是基于一些背景有rank先后的。训练和测试数据是一些乘客的个人信息以及存活状况,要尝试根据它生成合适的模型并预测其他人的存活状况。对,这是一个二...原创 2019-03-10 14:32:36 · 3549 阅读 · 0 评论 -
kaggle(02)-房价预测案例(基础版)
# 房价预测案例## Step 1: 检视源数据集import numpy as npimport pandas as pd#### 读入数据* 一般来说源数据的index那一栏没什么用,我们可以用来作为我们pandas dataframe的index。这样之后要是检索起来也省事儿。* 有人的地方就有鄙视链。跟知乎一样。Kaggle的也...原创 2018-03-27 09:06:22 · 1719 阅读 · 4 评论 -
kaggle(03)-自行车租赁预测问题(基础版)
文章目录问题描述:问题解决分析问题:解决问题第一步:读取原始数据第二步:观察原始数据第三步:原始数据的可视化第四步:数据的预处理时间属性的分解第五步:数据的特征提取特征生成特征选择第六步:训练baseline第七步:模型的状态估计(通过学习曲线)第八步:模型优化问题描述:在对一个应用使用机器学习算法之前我们应该要分析清楚问题是什么本次项目所要解决的问题是:通过共享单车上的传感器采集的数据和...原创 2019-03-10 16:01:07 · 2857 阅读 · 3 评论 -
常见人工智能比赛平台总结
人工智能比赛调研.md目录1.kaggle比赛1.1 kaggle比赛是什么?1.2 为什么举办kaggle比赛?1.3 kaggle比赛形式是什么?1.4 kaggle比赛的奖励制度是什么?2.阿里天池比赛2.1 阿里天池比赛是什么?2.2 为什么举办阿里天池比赛?2.3 阿里天池比赛的形式有哪些?2.4 阿里天池比赛的奖励机制有哪些?3.华为大数据比赛3.1 华为大数据比赛是什么?3.2 ...原创 2019-03-15 09:39:22 · 4736 阅读 · 1 评论 -
kaggle (02) - 房价预测案例(进阶版)
房价预测案例(进阶版)这是进阶版的notebook。主要是为了比较几种模型框架。所以前面的特征工程部分内容,我也并没有做任何改动,重点都在后面的模型建造sectionStep 1: 检视源数据集import numpy as npimport pandas as pd读入数据一般来说源数据的index那一栏没什么用,我们可以用来作为我们pandas dataframe的index...原创 2019-03-17 10:50:00 · 621 阅读 · 0 评论 -
kaggle(04)---avazu_ctr_predictor(baseline)
比赛的目的:通过分析网上的系统日志和用户行为信息,来预测某些网页上项目的点击率。是一个二分类的问题,只需要预测出用户是否点击即可最好能够输出某个概率,比如:用户点击某个广告的概率。比赛官网文件信息:train - Training set. 10 days of click-through data, ordered chronologically. Non-clicks and ...原创 2019-03-18 08:39:23 · 3055 阅读 · 7 评论 -
Event Recommendation Engine Challenge(基础版)---代码
第一步:统计user和event相关信息#查看train_csv的数据import pandas as pddf_train = pd.read_csv('train.csv')df_train.head() user event invited timestamp interested ...原创 2019-03-31 16:38:58 · 9758 阅读 · 0 评论 -
kaggle(05)---Event Recommendation Engine Challenge(基础版)
文章目录目录1.比赛相关介绍1.1 比赛介绍1.2 数据集介绍1.3 评价标准介绍1.4 个人理解2. 解决方案2.1 统计用户和event信息2.2 计算用户相似度2.3 用户社交关系信息处理2.4 构建event和event相似度数据2.5 活跃度/event热度数据2.6 构建特征2.7 模型构建和预测3. 遇到的问题4. 总结目录kaggle比赛官网链接下载好的数据集链接(百度云,提...原创 2019-03-31 16:39:56 · 1187 阅读 · 0 评论