kaggle竞赛流程简介——以手写识别为例

最新推荐文章于 2022-10-11 12:00:37 发布

一名分析狮

最新推荐文章于 2022-10-11 12:00:37 发布

阅读量3.5k

点赞数

分类专栏： kaggle 文章标签： kaggle 数据挖掘提交结果

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lee20093905/article/details/78903653

版权

本文介绍了kaggle手写识别竞赛的流程，包括数据集下载、数据说明、模型建模及预测结果提交。通过二值化处理、训练验证、模型拟合等步骤，最终将predict.csv文件上传到kaggle平台获取评分。

摘要由CSDN通过智能技术生成

下载数据集

https://www.kaggle.com/c/digit-recognizer/data
数据包含三个csv文档。训练集 train.csv、测试集 test.csv、结果提交模版 sample_submission.csv。

数据说明

数据文件train.csv和test.csv包含的手绘位灰度图像，从0到9。每一行代表一个数字，不同的是train.csv中包含标签列，test.csv不包含标签列。

图片的像素大小为 28 x 28 ，每个像素具有与它相关联的单个像素值，表示像素的亮度或暗度，数字越大意味着较暗。这个像素值是0到255（含）之间的整数。也就是说 0 为白色，255 为黑色。

建模过程

二值化
由于训练集的像素值包含了0-255之间不同的值，因此我们需要对每个图片的特征进行二值化。二值化的处理方式是：设置一个阈值，大于该阈值的设置成255，小于该阈值的设置成0。
```
import pandas as pd
from sklearn import metrics
from sklearn.model_s
```

最低0.47元/天解锁文章

一名分析狮

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
kaggle竞赛流程简介——以手写识别为例

下载数据集https://www.kaggle.com/c/digit-recognizer/data 数据包含三个csv文档。训练集 train.csv、测试集 test.csv、结果提交模版 sample_submission.csv。数据说明数据文件train.csv和test.csv包含的手绘位灰度图像，从0到9。每一行代表一个数字，不同的是train.csv中包含标签列...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。