kaggle 入门
1,注册kaggle账号
以前从来没有接触过kaggle,有次在某乎上看到还有这东西,于是注册了账号准备试试。
注册的时候邮件验证显示不了验证码,在网上看到说是要翻墙才能看到。于是让能翻墙的同学给我填的验证码。
注册之后就随便摸索一下里面的布局和内容
找一个经典入门项目开始分析,选了个Digit Recognizer,因为在机器学习实战上看到过这个案例,就选了它
点进去是详细介绍,先看看介绍,然后看看数据格式和内容,在把数据下载到本地
使用算法:KNN
算法,python,数据处理都是第一次接触,写的很是low
一共三个数据文件,
- train.csv是训练数据,数据一共是28000*875,第一行是数据描述,第一列是label,将第一行去掉,得到280001*784的数据,第一列拿出来作为trainLabel,其余的是trainSet
- test.csv是测试数据,里面没有label
- sample_submission.csv是提交格式,提交结果就按照这个格式,第一行是ImageId,Label,第一列是序号,第二列为预测结果。
读数据
#