![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据结构
文章平均质量分 89
whoami_zy
whoami
展开
-
Spark机器学习库(ML)之分类模型-bayes和svm
今天我们要学习的是Spark中的分类算法中的贝叶斯模型以及SVC模型,这里还是通过一个小实例来实现。就是垃圾邮件识别。 首先我们还是先来简单的介绍一下算法吧。 朴素贝叶斯模型 首先我们先假设各个向量之间是相互独立的。朴素贝叶斯(简称NB)就是在这个假设条件下的。朴素贝叶斯属于生成式模型,它的收敛速度将快于判别式模型比如逻辑回归,所以你只需要较少的训练数据即可。即使贝叶斯条件独立假设不成立,NB分类器在实践中任然表现很出色。但是它的主要缺点是它不能学习特...原创 2021-06-20 17:31:27 · 834 阅读 · 0 评论 -
自动化运维小工具-Ansible简单介绍
这个小工具是我之前工作中搭建大数据平台使用到的。在多服务器场景下挺方便的。挺好用。 一、介绍 ansible是一款自动化运维工具,基于Python开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,可以在集群多机器之间进行交互。比如执行相同的shell命令、拷贝文件到各个服务器、ping测试、服务器相关主机信息(包括主机名,内存,cpu,磁盘等)、定时执行模块等。 ansible是基于模块工作的,本身没有批量部署的能力。真正具有批量部署的是ansibl原创 2021-06-20 17:23:57 · 329 阅读 · 0 评论