K-近邻算法

最新推荐文章于 2024-09-19 21:18:54 发布

yanink

最新推荐文章于 2024-09-19 21:18:54 发布

阅读量288

点赞数

文章标签：人工智能 python 技术

本文链接：https://blog.csdn.net/yanink/article/details/72818368

版权

我们有一组数据集合，该数据集合我们已经分好类了，知道哪个数据是属于哪个类别的。在这个数据集合基础上，我们拿到了一个新的数据，那么，我们如果认为这个数据应该是属于哪个类别呢？

在K-近邻算法中，我们把这个新的数据和已知的数据集合中的每一数据进行距离的计算，然后选择出K个距离最近的已知数据，在这K个距离最近的已知数据中，看哪些类别出现的概率是最大的。哪个类别概率最大，那么这个新的数据就最可以属于这个类别。

这就是：K-近邻算法。

看上去很简单，主要技术点在距离的计算这块。

距离的计算主要使用欧式公式进行，可以google下相关算法。

K-近邻算法：

from numpyimport *

import operator

from os importlistdir

defclassify0(inX, dataSet, labels, k):

dataSetSize = dataSet.shape[0]

diffMat = tile(inX, (dataSetSize,1)) -dataSet

sqDiffMat = diffMat**2

sqDistances = sqDiffMat.sum(axis=1)

distances = sqDistances**0.5

sortedDistIndicies =distances.argsort()

classCount={}

for i in range(k):

voteIlabel =labels[sortedDistIndicies[i]]

classCount[voteIlabel] =classCount.get(voteIlabel,0) + 1

sortedClassCount = sorted(classCount.iteritems(),key=operator.itemgetter(1), reverse=True)

return sortedClassCount[0][0]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yanink

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

使用Weka进行K-近邻算法和K-均值算法的使用-附件资源

03-02

使用Weka进行K-近邻算法和K-均值算法的使用-附件资源

k-近邻算法_K-近邻算法_K._

09-29

**k-近邻算法（K-Nearest Neighbors，简称KNN）** k-近邻算法是一种基于实例的学习，属于监督学习方法，广泛应用于分类和回归问题。在分类任务中，KNN的基本思想是：对于一个新的未知类别的数据点，我们将其划归到...

参与评论您还未登录，请先登录后发表或查看评论

机器学习实战-k-近邻算法改进约会网站的配对效果

08-15

在本实践项目中，我们将深入探讨如何利用机器学习中的k-近邻算法（K-Nearest Neighbors，简称KNN）来改进约会网站的配对效果。KNN是一种非参数监督学习方法，常用于分类和回归任务。在这个案例中，我们将关注其在...

【AI大模型】Kimi API大模型接口实现

qq_25888559的博客

09-15

1196

Kimi智能助手在效率（免费榜）排名从2024年1月14日的第436名提升至3月19日的第11名。而尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token，能同时处理约20万个单词，Kimi升级后，长文本能力为其10倍。在2023年10月初次亮相时，该模型的处理能力还仅有约20万汉字。2024年3月18日，月之暗面宣布Kimi智能助手启动200万字无损上下文内测。

使用c#制作一个小型桌面程序

qq_44691564的博客

09-14

1604

创建.NET Framework新项目，将之前生成的dll放在Demo文件夹的bin ->debug或是 release中（看你自己用的什么模式），创建完成后系统会自动生成一些文件，其中 pch.cpp 先不要修改，pch.h中先导入自己需要用到的库，下面是我的代码。布局完了之后会自动生成Form1.Designer.cs 的窗口设计代码，点击控件按F4 还可以修改他们的属性。完成之后点击生成就可以在bin中出现的你的.exe文件咯，是不是很简单呀~[狗头]我们还需要一个入口主程序。

车辆检测与分类系统源码分享

xuehaikj的博客

09-13

1548

数据集信息展示在本研究中，我们采用了名为“comexit”的数据集，以支持对YOLOv8模型在车辆检测与分类任务中的改进。该数据集专注于交通工具的识别，特别是公共交通和货运车辆，具有明确的应用背景和实用价值。数据集的类别数量为三，具体包括“bus”（公交车）、“car”（小汽车）和“truck”（卡车）。这三类车辆在城市交通和物流系统中扮演着重要角色，因此，准确的检测与分类对于交通管理、智能交通系统以及自动驾驶技术的发展具有重要意义。

opencv学习：calcHist 函数绘制图像直方图及代码实现

mohanyelong的博客

09-13

1584

opencv学习：calcHist 函数绘制图像直方图及代码实现

数据爬虫中遇到验证码的解决方法

sheji888的专栏

09-17

1265

数据爬虫中遇到验证码是一个复杂而常见的问题，需要综合考虑多种因素并采取合适的解决策略。通过避免触发验证码、手动输入验证码、使用验证码识别技术、绕过验证码机制以及采用分布式爬虫和代理IP等方法，可以在一定程度上提高爬虫的稳定性和效率。然而，需要注意的是，爬虫的使用必须遵守相关法律法规和网站爬虫协议的要求，确保数据抓取活动的合法性和合规性。

Djourney新手入门基础，AI摄影+AI设计+AI绘画-AIGC作图

DAMOXINGHAITAI的博客

09-14

1075

（全套教程文末领取哈）从大模型系统设计入手，讲解大模型的主要方法；在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；以SD多模态大模型为主，搭建了文生图小程序案例；以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

介绍一下常用的激活函数？

最新发布

GamBleout的博客

09-19

339

死神经元：当神经网络中的某些神经元在训练过程中始终不被激活，即其输出值始终接近于零，这些神经元就被称为“死神经元”。与Sigmoid函数类似，也存在梯度消失问题，但相对于Sigmoid函数，其输出范围更大，有利于梯度的传播。Leaky ReLU是ReLU的一个变体，在输入为负时给予一个小的非零斜率，避免了“死神经元”问题。在正区间内解决了梯度消失问题，但在负区间内梯度为0，可能导致“死神经元”问题。将一组数值转换为概率分布，即所有输出的和为1，且每个输出都在(0,1)之间。当输入为负时，输出为0。

常见本地大模型个人知识库工具部署、微调及对比选型

09-14

910

由于作者的眼界、精力和能力也有限，并且确实也不是专业的AI研究员，仅仅是一位兴趣使然的爱好者，这里列出的几款也单纯只是作者平常关注到的，所以可能也不全，请各位见谅！文章从起笔写到这里已经过了三天了，这三天也基本把上文提到的大模型侧工具全部体验了一遍，下面说一下主要结论吧。从功能丰富度和性能优化的角度综合评估，LM Studio明显更胜一筹。从工具本身使用及模型部署效率来看，Ollama的上手速度会更快，使用会更便捷，效率也会更高。从企业级稳定性和高可用。

2024.9.16 day 1 pytorch安装及环境配置

m0_58285219的博客

09-16

611

pytorch安装及环境配置

AI下凡记：智能体如何走进我们的日常生活

Enweitech Software Works

09-19

750

随着AI行业的不断发展，未来必然会出现更自然的人机交互方式，智能体将会充当中间的沟通桥梁，App将解构成颗粒度更小的服务，由智能体担当智能耦合的角色，在这样的背景下，智能体将有望成为新的流量入口，所以，提前布局智能体，对大厂的商业生态非常重要。因此，新一轮的智能体争夺战，虽然从流量入口开始，但最终考验的却是企业的生态运营能力，企业前端要有足够的场景化牵引力，内部要有流畅的场景协调能力，外部要有创新的模式，以及提供持续优化的用户体验，才是智能体时代优秀的“流量入口”。后者则是创造需求，引来流量。

探索未来智能：Moonshot AI 引领AI新纪元——M1超级模型

BuluAI的博客

09-19

460

M1超级模型的诞生是对这一趋势的直接响应，它代表了Moonshot AI在AI领域的最新研究成果和对未来智能的深刻洞察。一个在线教育平台集成了M1超级模型，通过分析学生的学习行为和成绩，为每位学生提供定制化的学习路径和实时反馈，显著提高了学习效率和成绩。在教育领域，M1超级模型能够提供个性化的学习支持，通过分析学生的学习习惯和理解能力，提供定制化的学习材料，促进学生在关键领域的进步。一家医院利用M1超级模型分析患者的医疗影像和病历，提高了诊断的准确性，减少了误诊率，并为医生提供了更全面的治疗建议。

【人工智能学习笔记】7_智能语音技术基础

RIKI_1

09-19

1150

声道：录制声音时，在不同的空间位置采集的相互独立的音频信号。声道数也就是声音录制时的音源数量。常见的音频数据为单声道或双声道（立体声）比特率：数据传输单位时间内传输的数据位数，也就是每秒的传输速率。比特率越高，传送数据速度越快。音频采样率：音频采样率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高，传送数据速度越快。音频采样位数：采样值或取样值，即是将采样样本幅度量化。用来衡量声音波动变化的参数，或是声卡的分辨率。数值越大，分辨率越高，发出声音的能力越强。

PathoDuet: H&E 和 IHC 染色病理切片分析的基础模型|文献速递-Transformer架构在医学影像分析中的应用

weixin_38594676的博客

09-19

477

为了验证我们模型的有效性，我们在多个下游任务中评估了其性能，包括H&E领域的病理切片级别结直肠癌亚型分类、全切片图像（WSI）级别的分类，以及IHC领域的标记物表达水平预测、肿瘤识别和切片级别的定性分析。然而，仅凭IHC染色切片难以进行有效的解释，H&E染色切片作为基本的参考，提供了必要的上下文信息和结构细节，补充了从IHC切片中获得的分子信息。由于公开的IHC数据有限，我们利用已训练的H&E基础模型并引入了“跨染色迁移”预训练任务，以加深对不同染色方式的病理图像的理解。(a) 三分支跨尺度定位网络。

高效率的开发工具

鱼遇海

09-12

951

智能代码编辑:语法高亮: 支持多种编程语言的语法高亮。代码补全: 提供智能代码补全和提示，减少打字量。代码片段: 支持代码片段和模板，帮助快速编写常用代码。调试功能:集成调试器: 支持多种语言的调试，提供断点、变量监视、调用堆栈等功能。调试配置: 允许用户自定义调试配置，以适应不同的开发需求。版本控制:Git 集成: 内置 Git 支持，可以直接从编辑器进行版本控制操作，如提交、推送、拉取等。版本差异查看: 提供图形化界面查看文件差异和版本历史。

深度学习实战电路板缺陷检测【数据集+YOLOv5模型+源码+PyQt5界面】

weixin_40280870的博客

09-16

1621

深度学习电路板缺陷检测，模型采用YOLOV5作为框架，界面采用PyQt5构建，图像源支持图像、视频、摄像头以及RTSP等主流格式，电路板缺陷数据集一共690张图象左右，包含六种缺陷，missing_hole【缺失孔】, mouse_bite【鼠咬】, open_circuit【开路】, short【短路】, spur【杂散】, spurious_copper【杂铜】

机器学习入门：K-近邻算法原理与应用

机器学习—K-近邻算法[入门] K-近邻算法（K-Nearest Neighbour algorithm），又称为KNN算法，是数据挖掘技术中原理最简单的算法。该算法的工作原理是：给定一个已知标签类别的训练数据集，输入没有标签的新数据后，...