KNN

最新推荐文章于 2024-08-08 22:03:12 发布

zhouxiuli1001

最新推荐文章于 2024-08-08 22:03:12 发布

阅读量1.7k

点赞数

分类专栏：数据挖掘 R 文章标签： R KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouxiuli1001/article/details/82496325

版权

本文介绍了KNN算法的基本思想，包括选择近邻的标准和距离度量方法，如欧氏距离、绝对距离和切比雪夫距离等。讨论了近邻个数k的选择对预测误差的影响，并通过R语言的knn函数进行模拟分析。利用1992年美国总统选举数据，展示了knn算法在不同k值下的错判率，指出k=35和55时的较低错判率。

摘要由CSDN通过智能技术生成

1、基本思想：
将样本包含的n个观测数据看成p维（p个输入变量）特征空间中的点，为预测一个新观测X0输出变量y0的取值，首先在已有数据中找到与X0相似的K个观测，如（X1, X2, …, Xk），这些观测称为X0的近邻。对于分类问题，预测值应为最大概率值对应的分类；对于回归预测问题，是近邻输出变量的平均值。
核心问题：依据怎么的标准选择近邻？选择几个近邻（k如何确定）？
2、近邻标准–距离
对于p维空间的任意两点x 和 y
2.1 闵可夫斯基距离
P：变量数；k:任意指定
2.2 欧氏距离:闵可夫斯基距离k=2时的特例。
2.3 绝对距离:闵可夫斯基距离k=1时的特例。
2.4 切比雪夫距离:CHEBYCHEV（x，y）=max（｜ xi-yi｜），i=1，2，…，p。
2.5 夹角余弦距离: 这里写图片描述
夹角余弦越大，两观测变量整体结构相似度越高。

注：为使各输入变量对距离有“同等的贡献”，计算距离前应对数据进行预处理以消除数量级差异。如极差法：

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zhouxiuli1001 CSDN认证博客专家 CSDN认证企业博客

码龄10年

8: 原创

33万+: 周排名

229万+: 总排名

1万+: 访问

: 等级

282: 积分

7: 粉丝

3: 获赞

4: 评论

42: 收藏

私信

关注

热门文章

分类专栏

python 1篇
数据挖掘 8篇
统计分析 1篇
R 5篇

最新评论

Anaconda下更新Spyder
qq_17462909: 请教一下 Run current cell 4.0不能选中执行了，请问有解决办法吗
KNN
张志川: [code=python] --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython> in <module>() 4 import pickle as pk 5 import numpy as np ----> 6 from julyedu.data_utils import load_CIFAR10 7 import matplotlib.pyplot as plt 8 get_ipython().magic('matplotlib inline') ~\Desktop\image linear classification\julyedu\data_utils.py in <module>() ----> 1 import Pickle as pickle 2 import numpy as np 3 import os 4 5 def load_CIFAR_batch(filename): ModuleNotFoundError: No module named 'Pickle' [/code]求大神指点这是怎么回事
kaggle心得
zhouxiuli1001 回复 icey_: 一起学习~
kaggle心得
icey_: 最近也看到这个题，没想到大佬的数据都已经处理完了。厉害呀，小白学习中。。。。。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。