kaggle竞赛流程简介——以手写识别为例

本文介绍了kaggle手写识别竞赛的流程,包括数据集下载、数据说明、模型建模及预测结果提交。通过二值化处理、训练验证、模型拟合等步骤,最终将predict.csv文件上传到kaggle平台获取评分。
摘要由CSDN通过智能技术生成

下载数据集

https://www.kaggle.com/c/digit-recognizer/data
数据包含三个csv文档。训练集 train.csv、测试集 test.csv、结果提交模版 sample_submission.csv。

数据说明

数据文件train.csv和test.csv包含的手绘位灰度图像,从0到9。每一行代表一个数字,不同的是train.csv中包含标签列,test.csv不包含标签列。

图片的像素大小为 28 x 28 ,每个像素具有与它相关联的单个像素值,表示像素的亮度或暗度,数字越大意味着较暗。这个像素值是0到255(含)之间的整数。也就是说 0 为白色,255 为黑色。

建模过程

  • 二值化
    由于训练集的像素值包含了0-255之间不同的值,因此我们需要对每个图片的特征进行二值化。二值化的处理方式是:设置一个阈值,大于该阈值的设置成255,小于该阈值的设置成0。

    import pandas as pd
    from sklearn import metrics
    from sklearn.model_s
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值