Why
使用ApacheAccumulo,用户可以跨集群存储和管理大型数据集。Accumulo用途Apache Hadoop的HDFS来存储它的数据和阿帕奇动物园管理员为了达成共识。虽然许多用户直接与Accumulo交互,但有几个开源项目使用Accumulo作为其基础存储。
类比hbase。
介绍
Apache Accumulo是一个排序的分布式密钥/值存储,它提供健壮的、可伸缩的数据存储和检索。
Apache Accumulo 是一个可靠的、可伸缩的、高性能的排序分布式的 Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理。
特征:
服务器端编程:
Accumulo有一个编程机制(称为迭代器),可以在数据管理过程中的各个点修改键/值对。
基于小区的访问控制:
每个accumulo键/值都是对自己的安全标签它限制基于用户授权的查询结果。
设计:
Accumulo在集群上运行一个或多个hdfs实例。节点可以随着accumulo中存储的数据量的变化而添加或删除。
实战:
快速启动:
1单节点运行
下载架包
https://accumulo.apache.org/downloads/
之后就是解压
Tar -xzvf accumulo-X.Y.Z-bin.tar.gz
在配置前可以配置一些本机代码。提高其性能和稳定性、使用以下命令构建本机代码。
./bin/build_bative_libraryt.sh
之后是修改秘钥在conf/accumulo-site.xml
配置依赖信息。
Zookeeper的位置,