knn分类算法java源码_JAVA实现KNN分类

个人博客站已经上线了,网址 www.llwjy.com ~欢迎各位吐槽~

-------------------------------------------------------------------------------------------------

在開始之前先打一个小小的广告,自己创建一个QQ群:321903218,点击链接加入群【Lucene案例开发】,主要用于交流怎样使用Lucene来创建站内搜索后台,同一时候还会不定期的在群内开相关的公开课,感兴趣的童鞋能够加入交流。

KNN算法又叫近邻算法,是数据挖掘中一种经常使用的分类算法,接单的介绍KNN算法的核心思想就是:寻找与目标近期的K个个体,这些样本属于类别最多的那个类别就是目标的类别。比方K为7,那么我们就从数据中找到和目标近期(或者类似度最高)的7个样本,加入这7个样本相应的类别分别为A、B、C、A、A、A、B,那么目标属于的分类就是A(由于这7个样本中属于A类别的样本个数最多)。

算法实现

一、训练数据格式定义

以下就简单的介绍下怎样用JAVA来实现KNN分类,首先我们须要存储训练集(包含属性以及相应的类别),这里我们对未知的属性使用泛型。类别我们使用字符串存储。

/**

*@Description: KNN分类模型中一条记录的存储格式

*/

package com.lulei.datamining.knn.bean;

public class KnnValueBean{

private T value;//记录值

private String typeId;//分类ID

public KnnValueBean(T value, String typeId) {

this.value = value;

this.typeId = typeId;

}

public T getValue() {

return value;

}

public void setValue(T value) {

this.value = value;

}

public String getTypeId() {

return typeId;

}

public void setTypeId(String typeId) {

this.typeId = typeId;

}

}

二、K个近期邻类别数据格式定义

在统计得到K个近期邻中,我们须要记录前K个样本的分类以及相应的类似度,我们这里使用例如以下数据格式:

/**

*@Description: K个近期邻的类别得分

*/

package com.lulei.datamining.knn.bean;

public class KnnValueSort {

private String typeId;//分类ID

private double score;//该分类得分

public KnnValueSort(String typeId, double score) {

this.typeId = typeId;

this.score = score;

}

public String getTypeId() {

return typeId;

}

public void setTypeId(String typeId) {

this.typeId = typeId;

}

public double getScore() {

return score;

}

public void setScore(double score) {

th

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值