- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 kafka基本概念
Kafka[1] 是一种高吞吐量[2] 的分布式发布订阅消息系统,有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量[2] :即使是非常普通的硬件Kafka也可以支持每秒数百万[2] 的消息。支持通过Kafka服务器和消费机集群来分区消息。支持Hadoop并行数据加载。[3] kafka基本概念:BrokerKafka集群...
2018-05-06 10:14:07 1158
转载 docker 和vagrant比较
vagrant:Vagrant是一个基于Ruby的工具,用于创建和部署虚拟化开发环境。它 使用Oracle的开源VirtualBox虚拟化系统,使用 Chef创建自动化虚拟环境docker:Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。一个完整...
2018-05-01 08:46:38 9717
转载 大数据集群搭建文章
收集一下大数据集群环境搭建文章:https://wenku.baidu.com/view/0a9c4ebc50e79b89680203d8ce2f0066f433645e.htmlhttps://blog.csdn.net/youzhouliu/article/details/66973596?locationNum=15&fps=1https://segmentfault.com/a/1...
2018-05-01 07:47:06 1427
转载 CDH 和ambari之间的比较
1 什么是CDH,ambari?Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。Apache Ambari 支持HDFS、MapReduce、Hive、Pig、Hbase、Zookepe...
2018-05-01 07:33:48 27648 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人