自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 knn案例:预测乳腺癌的良性或恶性

个特征,包括肿瘤的半径、纹理、对称性等,以及目标变量,即肿瘤的性质(在构建模型之前,记得对数据进行标准化,以确保不同特征的尺度一致。使用准确率作为评估标准,评估模型的性能。使用交叉验证来选择最优的。值,以提高模型的性能。

2024-04-26 08:18:09 639 3

原创 KNN算法——特征预处理

标准化是数据预处理中的一种常见技术,其目的是使数据集的特征在统计意义上具有相似的尺度,以便更好地进行分析和模型训练。避免特征权重偏向:如果特征的值处于不同的范围,那么模型可能会更多地关注值较大的特征,而忽略值较小的特征。帮助模型更快地收敛:当特征的值处于不同的范围时,模型可能需要更多的迭代才能找到最优解。提高模型的性能:归一化可以提高模型的性能,减少过拟合的风险,并改善模型的泛化能力。特征归一化是一种数据预处理技术,它有助于将不同特征的值缩放到相似的范围,以确保模型能够更好地学习和收敛。

2024-04-24 20:22:44 1047

原创 KNN算法

K近邻(K-Nearest Neighbors,简称KNN)算法是一种常用的监督学习算法,它可以用于分类和回归问题。KNN算法的基本思想是通过计算待分类样本与训练样本之间的距离,然后根据最近的K个邻居的类别来确定待分类样本的类别。

2024-04-23 20:13:32 1833

原创 机器学习的概述

1.人工智能(Artificial Intelligence):概念: 人工智能是一种广泛的概念,指的是使计算机系统能够执行类似于人类智能的任务的技术和方法。半监督学习是介于有监督学习和无监督学习之间的一种学习方法,其训练数据中同时包含有标签和无标签的数据。有监督学习是机器学习中一种常见的学习方法,其训练数据包含了输入和对应的输出标签。无监督学习是一种机器学习方法,其训练数据没有标签或输出,模型需要自行发现数据中的模式和结构。:模型未能充分学习数据中的模式和规律,导致在训练集和测试集上都表现不佳的现象。

2024-04-22 19:25:37 1420

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除