数据分析实战之KNN（对手写数字进行识别）

最新推荐文章于 2021-06-22 05:50:36 发布

柚子哦

最新推荐文章于 2021-06-22 05:50:36 发布

阅读量1.2k

点赞数 1

分类专栏：数据分析实战

本文链接：https://blog.csdn.net/hahaha66888/article/details/87973000

版权

本文通过sklearn库中的手写数字数据集，介绍如何运用KNN算法进行图像分类。首先进行数据加载和探索，然后划分训练集和测试集，并进行Z-score规范化处理。接着，使用KNN进行分类并计算准确率。最后，与SVM、朴素贝叶斯和决策树的分类准确率进行比较，结果显示KNN和SVM表现优秀。

摘要由CSDN通过智能技术生成

一、利用sklearn中自带的手写数据集做KNN分类。它包含了1797幅数字图像，每幅图像大小是8*8像素。

1、数据加载和数据探索

from sklearn.datasets import load_digits
digits = load_digits()   #加载数据
data = digits.data

2、训练集和测试集的划分

1）因为没有专门的训练集和测试集，需要对数据集进行划分，划分成训练集和测试集。训练集是图像，每个图像都是8*8的矩阵，所以不需要对它进行特征选择，将全部的图像数据作为特征矩阵。

from sklearn.model_selection import train_test_split
train_x,test_x,train_y,test_y = train_test_split(data,digits.target,test_size = 0.3,random_state = 33)

2） KNN 算法和距离定义相关，我们需要对数据进行规范化处理，采用Z-score规范化。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

柚子哦

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sklearn代码4 3-KNN手写数字的识别

weixin_44632711的博客

10-29

353

import numpy as np import cv2 import matplotlib.pyplot as plt %matplotlib inline from sklearn.neighbors import KNeighborsClassifier # bitmap 位图 digit = cv2.imread('./u=123514531,1306365842&fm=26&fmt=auto.bmp') plt.imshow(digit) # 将(三维的)彩色图片转换

数据分析——KNN算法

HENG302926的博客

09-22

972

KNN是通过测量不同特征值之间的距离进行分类。它的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别，其中K通常是不大于20的整数。 KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。下面通过一个简单的例子说明一下：如下图，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于红色三角形所占比例为2/3，绿色圆将被赋予红色三角形那个类，如果

参与评论您还未登录，请先登录后发表或查看评论

数据挖掘——KNN算法（手写数字分类）

weixin_45902007的博客

12-20

1086

KNN原理部分思维导图整理：手写数据分类实战，分别用KNN、SVM、朴素贝叶斯和决策树做分类器，统计比较四个分类器的准确率。 #1、导入需要的包和数据集（手写分类数据集） from sklearn.model_selection import train_test_split from sklearn import preprocessing from sklearn.metrics import accuracy_score from sklearn.datasets import load_di

KNN算法实现手写数字识别（Sklearn实现）

最新发布

11-11

《数据分析实战 - KNN算法-病例自动诊断分析》本文主要探讨如何运用Python编程和KNN（K-Nearest Neighbors）算法对医疗病例数据进行分类分析，特别是针对乳腺癌的诊断。KNN是一种监督学习算法，适用于分类任务，...

从0到1数据分析实战学习笔记（七）KNN对手写数字进行识别

qq_32782279的博客

01-15

166

KNN的工作原理 “近朱者赤，近墨者黑”可以说是KNN的工作原理。整个计算过程分为三步：计算待分类物体与其他物体之间的距离；统计距离最近的K个邻居；对于K个最近的邻居，它们属于哪个分类最多，待分类物体就属于哪一类。项目实战通过sklearn中自带的手写数字数据集来进行实战整个训练过程基本上都会包括三个阶段： 1.数据加载：我们可以直接从sklearn中加载自带的手写数字数据集； 2....

knn实战：如何对手写数字进行识别？

qiu_zhi_liao的博客

05-19

739

在 Python 的 sklearn 工具包中有 KNN 算法。KNN 既可以做分类器，也可以做回归。如果是做分类，你需要引用： from sklearn.neighbors import KNeighborsClassifier 如果是做回归，你需要引用： from sklearn.neighbors import KNeighborsRegressor 如何在...

【项目实践】：KNN实现手写数字识别（附Python详细代码及注释）

中科院AI算法工程师的博客

12-23

2256

↑ 点击上方【计算机视觉联盟】关注我们本节使用KNN算法实现手写数字识别。KNN算法基本原理前边文章已经详细叙述，盟友们可以参考哦！数据集介绍有两个文件：（1）trainingDigit...

KNN对手写体数字图片分类并预测

TonyHsuM的博客

08-14

986

本文采用Python实现KNN算法对手写体数字图片进行分类并预测结果参考文章：https://blog.csdn.net/asialee_bird/article/details/81051281 https://blog.csdn.net/zhili8866/article/details/53026269 https://2723364262.iteye.com/blog/2311663 一...

【机器学习实战】逻辑回归----digits手写数字分类

花丸大老师的博客

04-20

8415

【导入库和数据集】和线性回归一样，首先导入所需要用到的库和数据集。导入库： ##用于可视化图表 import matplotlib.pyplot as plt ##用于做科学计算 import numpy as np ##用于做数据分析 import pandas as pd ##用于加载数据或生成数据等 from sklearn import datasets ##加载线性模型 f...

机器学习sklearn之数据集划分+KNN算法

weixin_41599977的博客

04-21

3258

数据集划分 sklearn数据集划分API：sklearn.model_selection.train_test_split scikit-learn数据集API介绍 sklearn.datasets 加载获取流行数据集 datasets.load_xx() 获取小规模数据集，数据包含在datasets里 datasets.fetch_xx(data_home=None) ...

knn(k邻近算法)实现手写数字分类，

Barry-njr的博客

07-11

412

from sklearn import datasets digits = datasets.load_digits() from sklearn import neighbors #import sklearn from sklearn.model_selection import train_test_split #将数据切分成两部分：训练集和测试集 x_train,x_test,y_tra...

手写数字识别算法之kNN

weixin_46824122的博客

04-05

4785

手写数字识别算法之kNN 1、k-近邻算法 ①原理：存在一个样本数据集合，也称作训练样本集，并且样本集中每一个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每一个特征进行比较；然后算法提取样本集中特征最相近数据（最邻近）的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-邻近算法中k的出处。通常k是不大于20的整数。最后...

机器学习速成课程 | 练习 | Google Development——编程练习：使用神经网络对手写数字进行分类

weixin_39506322的博客

09-01

284

使用神经网络对手写数字进行分类学习目标：训练线性模型和神经网络，以对传统 MNIST 数据集中的手写数字进行分类比较线性分类模型和神经网络分类模型的效果可视化神经网络隐藏层的权重我们的目标是将每个输入图片与正确的数字相对应。我们会创建一个包含几个隐藏层的神经网络，并在顶部放置一个归一化指数层，以选出最合适的类别。设置首先，我们下载数据集、导入 TensorFlow...

Adaboost实现手写数字数据集的分类(sklearn)，浅析分类器数目、学习率的影响

weixin_42388833的博客

06-22

1155

使用Adaboot对手写数字数据集sklearn.datasets.load_digits进行分类。 1.首先对前五个数字进行了展示 2.训练AdaboostClassifier，使用AdaBoostClassifier.stagend_predict(x)可以获得分阶段的预测结果。求得对数据集的随着迭代次数增加（弱分类器的增加）的误差变化情况。观察可知，随着分类器的增加，Adaboost模型的分类的表现会更好。 3.最后研究了学习率对Adaboost模型的影响。在Adaboost中，学习率即每次新训

使用sklearn不同方法在digits手写数字数据集上聚类并用matplotlib呈现

碎片

10-27

7799

实验题目 Clustering with sklearn 实验内容测试sklearn中以下聚类算法在以上两个数据集上的聚类效果。使用不同的评估方法对实验结果进行评估。实验准备 sklearn库自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了，scikit-learn简称sklearn，支持包括分类，回归，降维和聚类四大机器学习算法。还包括...

【机器学习实战】利用KNN和其他分类器对手写数字进行识别

QianT

03-26

9796

一、在sklearn中创建KNN分类器如果是做分类，你需要引用：from sklearn.neihbors import KNeighborsClassifier 如果是回归，需要引用：from sklearn.neighbors import KNeighborsRegressor KNeighborsClassifier(n_neighbors=5, weights='uniform'...

机器学习应用：KDD CUP99入侵检测与数据分析实战

"这篇教程详细介绍了如何使用机器学习进行入侵检测和攻击识别，以KDD CUP 99数据集为例。作者强调了反对利用技术进行非法活动，并希望通过分享网络安全知识来促进防护意识。教程涵盖了数据预处理、KNN算法应用以及...