sparkMLlib
哈哈
yj2434
贪财好色,一身正气
展开
-
K-近邻(KNN)算法
一 . K-近邻算法(KNN)概述最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类原创 2020-11-24 01:05:28 · 125 阅读 · 0 评论 -
pyspark无法自动生成 conn_info_file
spark3.0.1 pyspark无法自动生成 conn_info_file原创 2020-11-23 00:54:08 · 171 阅读 · 0 评论