大数据与人工智能方向基础 ----- K近邻分类模型

目录

前言

一、分类问题的一般描述

二、K近邻分类算法的描述

三、K近邻分类的三个基本要素

3.1 距离向量

        3.1.1 典型的距离向量方式

         3.1.2 用于距离向量的样本的标准化预处理

3.2 超参数K值

3.2.1 对超参数K值进行选择的意义

 3.2.2 基于m-fold cross validation的K值选择

3.3 决策规则

3.3.1  多数表决(胜者为王)

3.3.2  基于距离的加权投票

四、K近邻算法的实现 ---- kd树

4.1  kd树的构建(CreateKDTree)

4.2 kd树的搜索


前言

有很多新手刚刚接触大数据与人工智能方向学习,如果不知道怎么着手的,跟我一起慢慢进步叭~


提示:以下是本篇文章正文内容,下面案例可供参考

关键词:分类问题的定义,KNN分类模型,距离度量,超参数,交叉验证,性能评价

一、分类问题的一般描述

基于上述样本集,设计分类模型 ---- 分类模型的监督式学习,对特征空间的任意观测x进行类别决策 ----- 模型的使用

二、K近邻分类算法的描述

K近邻算法没有训练过程,懒惰算法。

输入:①训练样本集D

 ②观测样本x

输出:观测样本x所属的类别y

STEP0.训练集D的输入部分预处理,并记录预处理的使用参数

STEP1.指定距离向量,并选择K值

STEP2.训练集D内找到预处理的样本x的前k个近邻,记为

             

 STEP3.结合指定的分类规则,对x的类别y进行预测:

             其中,

在给定训练集的前提下,样本是否预处理、不同距离向量方式、不同K值、不同的决策规则,均会导致不同的分类结果。

三、K近邻分类的三个基本要素

K近邻分类的三个基本要素:距离向量,超参数K值,决策规则

3.1 距离向量

        3.1.1 典型的距离向量方式

         3.1.2 用于距离向量的样本的标准化预处理

方式一:0

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值