使用逻辑回归进行MNIST数据集分类

这篇博客探讨了如何运用逻辑回归对MNIST手写数字数据集进行分类。介绍了数据集的特点,包括60000个训练样本和10000个测试样本,每个样本为28*28像素的灰度图像。文章还提及了实验结果,并提出疑问:为何要对分类系数进行可视化。
摘要由CSDN通过智能技术生成

MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片。

 

 

import time
import numpy as np
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import fetch_openml     #从openml.org网站导入数据
from sklearn.utils import check_random_state

t0=time.time()
train_samples=5000

#载入数据集
X, y = fetch_openml('mnist_784', version=1, return_X_y=True)
print(X.shape,y.shape)

#可视化样本,图形化显示前6个数据
fig,ax=plt.subplots(nrows=2,ncols=3,sharex='all',sharey='all')
ax = ax.flatten()
for i in range(6):
    img=X[i].reshape(28,28)
    ax[i].matshow(img)
plt.show()

 

 

逻辑回归是一种用于解决二分类问题的机器学习算法。在本实验中,我们使用逻辑回归算法来识别MINST(MNIST)手写数字数据集中的手写数字。 MNIST手写数字数据集一个经典的机器学习数据集,其中包含了一系列由手写数字图片组成的训练样本。每张图片都是28x28像素大小,灰度图像,被标记为0到9之间的数字。 在实验中,我们首先需要加载MNIST数据集,并对数据进行预处理。预处理包括将每张图片转换为一维向量、标准化像素值以及划分训练数据集和测试数据集。 接下来,我们将使用逻辑回归算法来训练模型。在训练阶段,我们将使用训练数据集来调整模型的权重参数,以便能够将输入图片正确分类为0到9的数字之一。训练过程中,逻辑回归算法将通过优化损失函数来最小化预测结果与真实标签之间的差异。 训练完成后,我们将使用测试数据集来评估模型的性能。通过将测试样本输入模型并将预测结果与真实标签进行比较,可以计算出模型的准确度、精确度、召回率等指标,以评估逻辑回归算法在MINST手写数字数据集上的识别能力。 在实验中,我们可以调整逻辑回归算法的超参数(如学习率、正则化项)来优化模型性能。另外,我们还可以使用特征工程来提取更有信息量的特征,从而提高模型的性能。 总而言之,通过使用逻辑回归算法识别MINST手写数据集,我们可以实现对手写数字的自动识别,并对模型的准确度进行评估和优化。这个实验不仅可以帮助我们理解逻辑回归算法的原理和应用,还可以为实际的手写数字识别问题提供有用的参考和指导。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值