- 博客(4)
- 收藏
- 关注
原创 knn案例:预测乳腺癌的良性或恶性
个特征,包括肿瘤的半径、纹理、对称性等,以及目标变量,即肿瘤的性质(在构建模型之前,记得对数据进行标准化,以确保不同特征的尺度一致。使用准确率作为评估标准,评估模型的性能。使用交叉验证来选择最优的。值,以提高模型的性能。
2024-04-26 08:18:09
639
3
原创 KNN算法——特征预处理
标准化是数据预处理中的一种常见技术,其目的是使数据集的特征在统计意义上具有相似的尺度,以便更好地进行分析和模型训练。避免特征权重偏向:如果特征的值处于不同的范围,那么模型可能会更多地关注值较大的特征,而忽略值较小的特征。帮助模型更快地收敛:当特征的值处于不同的范围时,模型可能需要更多的迭代才能找到最优解。提高模型的性能:归一化可以提高模型的性能,减少过拟合的风险,并改善模型的泛化能力。特征归一化是一种数据预处理技术,它有助于将不同特征的值缩放到相似的范围,以确保模型能够更好地学习和收敛。
2024-04-24 20:22:44
1047
原创 KNN算法
K近邻(K-Nearest Neighbors,简称KNN)算法是一种常用的监督学习算法,它可以用于分类和回归问题。KNN算法的基本思想是通过计算待分类样本与训练样本之间的距离,然后根据最近的K个邻居的类别来确定待分类样本的类别。
2024-04-23 20:13:32
1833
原创 机器学习的概述
1.人工智能(Artificial Intelligence):概念: 人工智能是一种广泛的概念,指的是使计算机系统能够执行类似于人类智能的任务的技术和方法。半监督学习是介于有监督学习和无监督学习之间的一种学习方法,其训练数据中同时包含有标签和无标签的数据。有监督学习是机器学习中一种常见的学习方法,其训练数据包含了输入和对应的输出标签。无监督学习是一种机器学习方法,其训练数据没有标签或输出,模型需要自行发现数据中的模式和结构。:模型未能充分学习数据中的模式和规律,导致在训练集和测试集上都表现不佳的现象。
2024-04-22 19:25:37
1420
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人