自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 利用KNN算法实现手写数字识别

接下来,我们创建一个KNN分类器对象,并使用训练数据对其进行训练。训练完成后,我们使用测试集对模型进行评估,计算测试集上的准确率。在该函数中,我们首先读取CSV文件中的数据,并对图像数据进行归一化处理。首先,我们需要准备一份包含手写数字图像和对应标签的数据集。我们使用了一个CSV文件,其中每行包含一个手写数字的图像数据和对应的标签。然后,我们将图像数据重塑为模型输入所需的格式,并使用模型对图像进行预测。最后,我们打印出预测结果,即模型识别的手写数字。这里,我们指定测试集的大小为数据集的20%,并使用。

2024-04-25 20:41:39 212

原创 探索鸢尾花数据集:使用Seaborn绘制成对特征散点图

鸢尾花数据集是机器学习领域中一个非常常见且易于理解的数据集,它包含了三种不同种类的鸢尾花(Setosa、Versicolour和Virginica)的四个特征(花萼长度、花萼宽度、花瓣长度和花瓣宽度)的测量值。定义一个函数dm02_irisdata_show(),这个函数将完成对数据集的加载、处理和可视化工作。这段代码展示了如何使用Python的sklearn和seaborn库来加载、处理和可视化鸢尾花数据集。首先,我们从sklearn.datasets中导入load_iris函数,用于加载鸢尾花数据集。

2024-04-24 16:58:37 443

原创 KNeighborsClassifier与KNeighborsRegressor的实现

这意味着在分类一个新的点时,它会查看最接近的1个邻居的类别,并将该类别分配给新的点。中的某个样本非常接近(或就是其中的一个),那么它的预测类别应该与那个样本的类别相同。是一个用于分类的模型,它基于实例的学习,通过测量不同数据点之间的距离来进行分类。从给定的数据中,我们可以看到有两个类别(0和1)。这个数据点将基于其在训练数据中的两个最近邻居的目标值进行预测。表示模型在预测时会考虑数据集中与目标点最近的2个邻居。y`是一个长度为4的目标向量,表示这4个样本的目标值。这样,模型就能基于给定的特征来预测类别了。

2024-04-23 18:18:39 476

原创 机器学习入门

待标记的样本所属类别就由这K个距离最近的样本投票产生。SVM的目标是找到这样一个超平面,使得不同类别的样本点被有效地分开,并且距离这个超平面最近的样本点的间隔最大。预处理的主要目标是提高数据质量,确保数据的一致性和准确性,从而为后续的特征工程、模型训练等步骤奠定坚实的基础。总的来说,决策树和随机森林都是强大的机器学习工具,它们各自的特点使得它们在不同的问题和场景中都能发挥出色的性能。总的来说,SVM通过寻找最优超平面来实现数据的分类和回归,其强大的性能和广泛的应用领域使其成为机器学习领域的一种重要工具。

2024-04-22 11:00:13 655

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除