人的身体第一-CSDN博客

原创利用KNN算法实现手写数字识别

接下来，我们创建一个KNN分类器对象，并使用训练数据对其进行训练。训练完成后，我们使用测试集对模型进行评估，计算测试集上的准确率。在该函数中，我们首先读取CSV文件中的数据，并对图像数据进行归一化处理。首先，我们需要准备一份包含手写数字图像和对应标签的数据集。我们使用了一个CSV文件，其中每行包含一个手写数字的图像数据和对应的标签。然后，我们将图像数据重塑为模型输入所需的格式，并使用模型对图像进行预测。最后，我们打印出预测结果，即模型识别的手写数字。这里，我们指定测试集的大小为数据集的20%，并使用。

2024-04-25 20:41:39 212

原创探索鸢尾花数据集：使用Seaborn绘制成对特征散点图

鸢尾花数据集是机器学习领域中一个非常常见且易于理解的数据集，它包含了三种不同种类的鸢尾花（Setosa、Versicolour和Virginica）的四个特征（花萼长度、花萼宽度、花瓣长度和花瓣宽度）的测量值。定义一个函数dm02_irisdata_show()，这个函数将完成对数据集的加载、处理和可视化工作。这段代码展示了如何使用Python的sklearn和seaborn库来加载、处理和可视化鸢尾花数据集。首先，我们从sklearn.datasets中导入load_iris函数，用于加载鸢尾花数据集。

2024-04-24 16:58:37 443

原创 KNeighborsClassifier与KNeighborsRegressor的实现

这意味着在分类一个新的点时，它会查看最接近的1个邻居的类别，并将该类别分配给新的点。中的某个样本非常接近（或就是其中的一个），那么它的预测类别应该与那个样本的类别相同。是一个用于分类的模型，它基于实例的学习，通过测量不同数据点之间的距离来进行分类。从给定的数据中，我们可以看到有两个类别（0和1）。这个数据点将基于其在训练数据中的两个最近邻居的目标值进行预测。表示模型在预测时会考虑数据集中与目标点最近的2个邻居。y`是一个长度为4的目标向量，表示这4个样本的目标值。这样，模型就能基于给定的特征来预测类别了。

2024-04-23 18:18:39 476

原创机器学习入门

待标记的样本所属类别就由这K个距离最近的样本投票产生。SVM的目标是找到这样一个超平面，使得不同类别的样本点被有效地分开，并且距离这个超平面最近的样本点的间隔最大。预处理的主要目标是提高数据质量，确保数据的一致性和准确性，从而为后续的特征工程、模型训练等步骤奠定坚实的基础。总的来说，决策树和随机森林都是强大的机器学习工具，它们各自的特点使得它们在不同的问题和场景中都能发挥出色的性能。总的来说，SVM通过寻找最优超平面来实现数据的分类和回归，其强大的性能和广泛的应用领域使其成为机器学习领域的一种重要工具。

2024-04-22 11:00:13 655

利用KNN算法实现手写数字识别

数据集

2024-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 利用KNN算法实现手写数字识别

原创 探索鸢尾花数据集：使用Seaborn绘制成对特征散点图