前言
一直在往机器学习的路上走,几年过去了,发现还是没真正踏上去,emmmm,行动吧。
首先是有熟悉一门编程语言,一析合【今天刚刚给自己改的昵称😁】主要熟悉python,所以可能会用到的环境为:python3.7
可能用到的库,用pip install 安装
numpy、pandas、matplotlib
sklearn
xgboost、...等等
0、注册kaggle账号: https://www.kaggle.com/
1、收集数据:从比赛页面下载数据
# 训练数据:10天的点击行为数据
train - Training set. 10 days of click-through data, ordered chronologically. Non-clicks and clicks are subsampled according to different strategies.
# 测试集:1天的数据,作为测试模型用
test - Test set. 1 day of ads to for testing your model predictions.
# 简单的提交文件:指导正确格式
sampleSubmission.csv - Sample submission file in the correct format, corresponds to the All-0.5 Benchmark.