大数据
林与夕
这个作者很懒,什么都没留下…
展开
-
分布式spark-2.1.0-bin-hadoop2.6集群环境搭建
安装spark之前需要安装scala-2.12.6spark初始目录状态配置scala环境变量vim ~/.bash_profileexport SCALA_HOME=/home/hadoop/spark/scala-2.12.6${SCALA_HOME}/bin键入source ~/.bash_profile使scala环境变量立刻生效键入scala...原创 2018-11-01 22:38:04 · 1034 阅读 · 0 评论 -
分布式HBase-1.2.1集群环境搭建
分布式HBase-1.2.1HBase是一个分布式的列式数据库,适合键值对的数据存取或者有序的数据存取 hdfs适合批处理,不支持随机查找,不适合增量数据,不支持数据更新hbase时hdfs的很好补充 行式存储和列式存储如果我们大部分时间需要关注整张表的内容而不是单独几列,并且所关注的内容是不需要通过任何聚集运算的,推荐使用行式存储如果比较关注的都是几列的内容,或者...原创 2018-11-01 22:41:37 · 597 阅读 · 0 评论 -
zookeeper-3.4.10分布式集群环境搭建
目录 1.初始机器状态2.修改所有机器上的zk环境变量3.修改配置文件zoo.cfg4.根据zoo.cfg到各个机器上手动创建dataDir目录5.根据zoo.cfg到各个机器上手动创建myid文件6.每台机器都要启动zk7.查看zk的状态8.批量启动zk脚本开发9.zk集群结构10.zk的基本使用11.zk的客户端api基本使用1....原创 2018-11-01 21:58:53 · 1008 阅读 · 4 评论