大数据
worn.xiao
这个作者很懒,什么都没留下…
展开
-
【kafka消息队列】
Kafka一kafka是什么Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop一样的日志...原创 2020-01-27 16:20:30 · 696 阅读 · 0 评论 -
hadoop
Hadoop一 hadoop1.1 什么是hadoopHADOOP是apache旗下的一套开源软件平台 HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 HADOOP的核心组件有 HDFS(分布式文件系统) YARN(运算资源调度系统) MAPREDUCE(分布式运算编程框架) 广义上来说,...原创 2019-09-08 22:07:19 · 453 阅读 · 1 评论