- 博客(4)
- 收藏
- 关注
原创 knn案例:预测乳腺癌的良性或恶性
1. 数据预处理: 在构建模型之前,记得对数据进行标准化,以确保不同特征的尺度一致。2. 选择合适的算法: 考虑使用 K 近邻算法(KNN)进行分类任务。3. 调参优化: 使用交叉验证来选择最优的 K 值,以提高模型的性能。4. 模型评估: 使用准确率作为评估标准,评估模型的性能。今天利用KNN算法完成一个项目。
2024-04-25 21:22:02 389
原创 【无标题】
标准化是数据预处理中的一种常见技术,其目的是使数据集的特征在统计意义上具有相似的尺度,以便更好地进行分析和模型训练。在标准化过程中,通常会对数据的特征进行线性变换,使其均值为0,标准差为1。消除特征间的量纲差异: 当特征具有不同的量纲(比如长度、重量、温度等),它们的数值范围可能相差很大,这会影响到某些机器学习算法的表现。避免特征权重偏向:如果特征的值处于不同的范围,那么模型可能会更多地关注值较大的特征,而忽略值较小的特征。提高模型的性能:归一化可以提高模型的性能,减少过拟合的风险,并改善模型的泛化能力。
2024-04-24 21:09:11 235
原创 机器学习--KNN算法
机器学习简单来说就是模仿人的行为学习的过程,其中,算法是重中之重,今天来说的就是KNN算法,学习算发首先就是先下载pycharm和Anaconda。• 一个样本最相似的 k 个样本中的大多数属于某一个类别,则该样本也属于这个类别。4.进行多数表决,统计 K 个样本中哪个类别的样本个数最多。5.将未知的样本归属到出现次数最多的类别。1.计算未知样本到每一个训练样本的距离。1.计算未知样本到每一个训练样本的距离。3.取出距离最近的 K 个训练样本。5.将未知的样本预测的值了。• K值过小:过拟合。
2024-04-23 20:32:01 290
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人