机器学习
文章平均质量分 56
spark ml
xiaoxaoyu
小小鱼
展开
-
pyspark安装文档
pyspark环境安装 一、python3环境安装 参考文档:pyspark安装 1、下载安装包 生产环境下的python安装包,tgz格式,C语言,没有编译过的。Java可以跨平台,只能针对当前计算机 https://www.python.org/ftp/python/3.6.4/ 也可以使用wget命令接上面的网址直接下载 2、安装python可能用到的依赖: yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-de原创 2021-04-13 10:46:27 · 822 阅读 · 0 评论 -
Kmeans入门
文章目录Kmeans算法简单实现生成数据集重写fit和predict方法定义一个子绘图函数执行输出如下:完整代码解释如下: Kmeans算法简单实现 平台:python 训练数据集:sklearn模块下的数据集 使用模块: import matplotlib.pyplot as plt:根据数据做出散点图 from sklearn.datasets._samples_generator import make_blobs from scipy.spatial.distance import cdist:求原创 2021-04-11 17:45:28 · 497 阅读 · 0 评论