本次手写数字识别数据取自美国邮政信封上的手写邮政(ZIP)编码

本文介绍了一个手写数字识别问题,数据来源于美国邮政信封的ZIP编码,涉及二分类(2和3)。文章讨论了Logistic回归、线性判别分析(LDA)、K近邻(KNN)和朴素贝叶斯模型,其中KNN在测试集上的准确率最高,达到96.98%。
摘要由CSDN通过智能技术生成

1. 数据说明

本次手写数字识别数据取自美国邮政信封上的手写邮政(ZIP)编码,每幅图是对一个五位数字邮政编码进行字符分割后,仅包含单个数字的图像。图像是 16 * 16 的8 位灰度图。数据集中的 V1 是手写的数字,可以是 2 或 3,为标记。数据集中的 V2-V257 是灰度值,为属性或特征。

本次作业只考虑“2”与“3”的二分类问题,训练集(train23.csv)与测试集(test23.csv)中只包含了手写的数字为“2”和“3”的数据。

训练集中,“2”的数量为731,“3”的数量为658。总共有1389个样本。

测试集中,“2”的数量为198,“3”的数量为166 。总共有364个样本。

2. 变量说明

训练集与测试集共有257个变量,其中第一个变量为标记,取值为2或3,后面256个变量为图像中256个像素点的灰度

3. 数据处理

读入训练集和测试集,并去除第一个变量,即标记变量

train <- read.csv("train23.csv")
train <- train[-1]
test <- read
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值