- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 spark-knn的简易实现
spark-knn,spark是一个很优秀的分布式计算框架,本文实现的knn是基于欧几里得距离公式实现的,下面开始起简单的实现,可能有多问题希望大家能够给指出来。 Logger.getLogger("org.apache.spark").setLevel(Level.WARN) Logger.getLogger("org.eclipse.jetty.server").setLevel(
2017-02-06 15:04:52 2408
原创 K最近邻(kNN,k-NearestNeighbor)
KNN最邻近规则,主要应用领域是对未知事物的识别,即判断未知事物属于哪一类,判断思想是,基于距离计算公式(欧几里得定理,余弦定理(文本分析)),判断未知事物的特征和哪一类已知事物的的特征最接近; K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本
2017-02-06 13:57:16 915
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人