大数据技术
文章平均质量分 94
大数据技术:是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
Dark_Ice_
游标卡尺为什么不寂寞——因为它不估读。
博客主要记录我日常学习的一些网络知识、编程、Linux和计算机等等有关的一切资料。本人热爱计算机技术,喜欢操作Linux系统,未来的目标是当一名运维工程师(网络知识也很强),一名技术大咖。记录博客,一是将知识点整理,方便以后查找;二是希望能帮助到有需要的人,共同学习交流。
也可以关注公众号“黑科技前哨站”,里面有许多文章以及相关的资源下载。
展开
-
Kafka 入门
目录消息中间件基本架构消息中间件的作用消费消息的两种模式发布订阅模式(一对多)Kafka基本概念代码示例消费消息消息中间件基本架构消息中间件基本上可以分为三部分: Product 生产者,消息的产生方,生产者会将消息发送到消息队列。 queue 消息队列,接受并存储生产者的消息。 Consumer 消费者,消费消息队列中的消息。 消息中间件的作用消息队列的主要作用削峰填谷、异步、解耦。消费消息的两种模式消息消费的两种模式,发布原创 2020-10-01 23:38:34 · 103 阅读 · 0 评论 -
Apache Kafka 集群部署指南
Kafka基础消息系统的作用应该大部分小伙伴都清楚,用机油装箱举个例子。所以消息系统就是如上图我们所说的仓库,能在中间过程作为缓存,并且实现解耦合的作用。引入一个场景,我们知道中国移动,中国联通,中国电信的日志处理,是交给外包去做大数据分析的,假设现在它们的日志都交给了你做的系统去做用户画像分析。按照刚刚前面提到的消息系统的作用,我们知道了消息系统其实就是一个模拟缓存,且仅仅是起到了缓存的作用而并不是真正的缓存,数据仍然是存...转载 2021-02-09 23:52:26 · 220 阅读 · 0 评论 -
Kafka原理详解
目录Kafka是什么?消息系统分类Peer-to-Peer (Queue)Publish/Subscribe(Topic)常用消息系统对比Kafka介绍Kafka架构简介主题和日志Distribution(分布)Geo-Replication(地域复制)Producers(生产者)Consumers(消费者)Consumer GroupGuarantees(担保)Kafka是什么?Kafka是Apache旗下的一款分布式流媒体平台,Kafka原创 2020-05-30 23:59:13 · 637 阅读 · 0 评论 -
一文带你读懂zookeeper在大数据生态的应用
目录一、简述二、基本概念1、数据结构2、Znode你应该了解的(1)节点类型(2)节点属性三、基本功能1、文件系统2、集群管理3、分布式锁机制4、监听与通知机制四、实际应用1、hadoop2、hbase3、kafka4、hive五、总结一、简述在一群动物掌管的世界中,动物没有人类聪明的思想,为了保持动物世界的生态平衡,这时,动物管理员—zookeeper诞生了。打开Apache zookeeper的官网,一句话定义zooke原创 2020-05-18 15:11:01 · 370 阅读 · 0 评论 -
实战|Hadoop大数据集群搭建
实验环境:主机名IP地址 角色qll251 192.168.1.251 NameNodeqll252 192.168.1.252 DataNode1qll253 192.168.1.253 DataNode2所需软件包: hadoop-2.9.2.tar.gz jdk-8u241-linux-x64.tar.gz 软件包下载地址:Hadoop软件包官方下...原创 2020-07-20 15:39:54 · 391 阅读 · 0 评论