![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
sunshingheavy
这个作者很懒,什么都没留下…
展开
-
带你搞懂朴素贝叶斯分类算法
带你搞懂朴素贝叶斯分类算法带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。1 分类问题综述 对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人...转载 2018-04-03 09:38:58 · 211 阅读 · 0 评论 -
Spark Streaming简介
转自:https://www.cnblogs.com/shishanyuan/p/4747735.html1、Spark Streaming简介1.1概述Spark Streaming是Spark核心API的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理。支持从多种数据源获取数据,包括Kafk、Flume、Twitter、ZeroMQ、Kinesis以及TCP so...转载 2019-09-06 14:16:26 · 199 阅读 · 0 评论 -
Spark Streaming(下)
转自:https://www.cnblogs.com/shishanyuan/p/4747749.htmlSpark入门实战系列--7.Spark Streaming(下)--实时流计算Spark Streaming实战【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取1、实例演示1.1流数据模拟器1.1.1流数据说明在实例演...转载 2019-09-06 14:23:23 · 156 阅读 · 0 评论 -
Spark Streaming Window窗体相关操作
转自:https://www.cnblogs.com/duanxz/p/4408789.htmlSpark Streaming之五:Window窗体相关操作SparkStreaming之window滑动窗口应用,SparkStreaming提供了滑动窗口操作的支持,从而让我们可以对一个滑动窗口内的数据执行计算操作。每次掉落在窗口内的RDD的数据,会被聚合起来执行计算操作,然后生成的RDD...转载 2019-09-06 15:07:50 · 288 阅读 · 0 评论 -
Spark MLlib 机器学习
转自:https://www.cnblogs.com/swordfall/p/9456222.htmlSpark MLlib 机器学习分类:Sparkundefined本章导读机器学习(machine learning, ML)是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多领域的交叉学科。ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识、新技能,并重组...转载 2019-09-06 16:46:16 · 452 阅读 · 0 评论 -
kafka入门:简介、使用场景、设计原理、主要配置及集群搭建
转自:https://www.aboutyun.com//forum.php/?mod=viewthread&tid=9341&extra=page%3D1&page=1&问题导读:1.zookeeper在kafka的作用是什么?2.kafka中几乎不允许对消息进行“随机读写”的原因是什么?3.kafka集群consumer和producer状态信息...转载 2019-09-18 15:16:08 · 184 阅读 · 0 评论