k-近邻算法笔记

六月一日培训笔记

  1. k-近邻算法
  2. 从文本解析和导入数据
  3. 归一化数据
  4. KNN原理

 

  1. 只选择样本数据中前K个最相似的数据,这就是K近邻算法中K的出处,通常K是不大于20的整数,最后,选择K个最相似的数据中出现次数最多的分类,作为新数据的分类。
  2. KNN算法指导思想“近朱者赤,近墨者黑”,由你的邻居来判别你的类别
  3. KNN计算步骤:
  • (1)算距离:给定测试对象,计算它与训练集中的每个对象的距离 (2)找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻 (3)做分类:根据这k个近邻归属的主要类别,来对测试对象分类
  • 距离或相似度的衡量:合适的距离衡量,距离越近应该意味着这两个点属于一个分类的可能性越大。角的距离衡量包括欧式距离、夹角余弦等。相对来说用余弦计算相似度比欧式距离更合适
  • 类别的判定:(1)投票决定:少数服从多数,近邻中哪个类别的点最多就分为该类 (2)加权投票法:根据距离的远近,对近邻的投票进行加权,距离越近则权重越大(权重为距离平方的倒数)
  • 优缺点(1)优点:简单,易于理解,易于实现,无需估计参数,无需训练,适合对稀有事件进行分类(例如当流失率很低时,比如低于0.5%,构建流失预测模型)特别适合于多分类问题 (multi-modal,对象具有多个类别标签),例如根据基因特征来判断其功能分类,KNN比SVM表现要好(2)缺点:懒惰算法,对测试样本分类时的计算量大,内存开销大,评分慢。可解释性较差,无法给出决策树那样的规则。

 

#对未知类别属性的数据集中的没个点依次执行以下操作:

(1)计算已知类别数据集中的点与当前点之间的距离;

(2)依照距离依次递增的次序排序;

(3)选取与当前点所在数据最小的k个点

(4)确定前k个点所在类别的出现频率

(5)返回前k个点出现频率最高的类别作为当前点的预测分类

 

# 使用Python导入数据

from numpy import #导入numpy数据包

impor operator #导入运算数据包

 

#加载样本数据的方法,返回样本数据和样本标签

def createDatabaseSet():

gtoup = array([[1.0,2.0],[1.2,0.1],[0.1,1.4],[0.3,3.5]]) #样本点数据

lables = ['A','A','B','B'] #样本点标签

return group,lables

array()数组 #很多人把二维的array也叫做矩阵

newValue = (Oldvalue-min)/(max-min) 数据进行相除

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
4S店客户管理小程序-毕业设计,基于微信小程序+SSM+MySql开发,源码+数据库+论文答辩+毕业论文+视频演示 社会的发展和科学技术的进步,互联网技术越来越受欢迎。手机也逐渐受到广大人民群众的喜爱,也逐渐进入了每个用户的使用。手机具有便利性,速度快,效率高,成本低等优点。 因此,构建符合自己要求的操作系统是非常有意义的。 本文从管理员、用户的功能要求出发,4S店客户管理系统的功能模块主要是实现管理员服务端;首页、个人心、用户管理、门店管理、车展管理、汽车品牌管理、新闻头条管理、预约试驾管理、我的收藏管理、系统管理,用户客户端:首页、车展、新闻头条、我的。门店客户端:首页、车展、新闻头条、我的经过认真细致的研究,精心准备和规划,最后测试成功,系统可以正常使用。分析功能调整与4S店客户管理系统实现的实际需求相结合,讨论了微信开发者技术与后台结合java语言和MySQL数据库开发4S店客户管理系统的使用。 关键字:4S店客户管理系统小程序 微信开发者 Java技术 MySQL数据库 软件的功能: 1、开发实现4S店客户管理系统的整个系统程序; 2、管理员服务端;首页、个人心、用户管理、门店管理、车展管理、汽车品牌管理、新闻头条管理、预约试驾管理、我的收藏管理、系统管理等。 3、用户客户端:首页、车展、新闻头条、我的 4、门店客户端:首页、车展、新闻头条、我的等相应操作; 5、基础数据管理:实现系统基本信息的添加、修改及删除等操作,并且根据需求进行交流信息的查看及回复相应操作。
现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集处理数据信息的管理方式。本微信小程序医院挂号预约系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息,使用这种软件工具可以帮助管理人员提高事务处理效率,达到事半功倍的效果。此微信小程序医院挂号预约系统利用当下成熟完善的SSM框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的MySQL数据库进行程序开发。微信小程序医院挂号预约系统有管理员,用户两个角色。管理员功能有个人心,用户管理,医生信息管理,医院信息管理,科室信息管理,预约信息管理,预约取消管理,留言板,系统管理。微信小程序用户可以注册登录,查看医院信息,查看医生信息,查看公告资讯,在科室信息里面进行预约,也可以取消预约。微信小程序医院挂号预约系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值