大数据组件安装部署
文章平均质量分 90
MrZhangBaby
世界上并没有完美的程序,
但我们并不因此而沮丧,
因为写程序本来就是一个不断追求完美的过程。
你可以不够优秀,但不要甘于平凡。
展开
-
Hive3.1.2伪分布式安装
Hive是何物,自己去百度,在此不多bb,直接开整…学习一个组件,个人觉得最重要的是先学会安装再说,巧妇难为无米之炊撒…原创 2023-07-13 18:39:16 · 403 阅读 · 0 评论 -
Mahout的安装部署和算法实现
Mahout的安装及配置 1-1、首先下载安装包 https://archive.apache.org/dist/mahout/ 1-2、解压并重命名: mv apache-mahout-distribution-0.12.2 mahout-0.12.2 1-3、配置环境变量: export MAHOUT_HOME=/Users/zhangchenguang/so...原创 2018-12-18 14:48:46 · 476 阅读 · 0 评论 -
大数据实时监控mysql数据库binlog(三)
解析binlog中间件 Ogg 这个玩意儿是oracle。并且还是收费的,所以在此贴上用户手册,就好了!这个玩意我可没有用过哦!只是在查资料的时候查到了一些,ogg是支持多种数据源的,阿里巴巴的canal、老外的Maxwell仅支持 mysql哦!所以如果有需求,用ogg也中,下面文档仅供参考!!! 下载地址:(还在审核中,明天更新地址,哈哈...)https://download...原创 2019-02-18 18:36:22 · 932 阅读 · 0 评论 -
CDH 和Ambari之间的优缺点
1 、什么是CDH,Ambari?Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。Apache Ambari 支持HDFS、MapReduce、Hive、Pig、Hbase、Zo...转载 2019-03-07 20:37:45 · 5226 阅读 · 4 评论 -
大数据伪分布式安装hadoop、hbase、hive等
工欲善其事,必先利其器。首先从安装部署说起吧...大数据组件jar包下载地址:CDH下载地址:http://archive.cloudera.com/cdh5/cdh/5/Apache下载地址:http://archive.apache.org/dist/2、安装jdk:解压:tar -xzvf jdk-7u79-linux-x64.tar.gz -C ...原创 2018-12-18 14:57:34 · 526 阅读 · 0 评论 -
大数据分布式环境搭建文档
分布式环境搭建文档Hadoop2.7.4+hbase1.3.1+jdk1.8+zookeeper3.4.9分布式和伪分布式的区别 简单的一句话概括一下,就是一台机器和多台机器的区别,加了一个zookeeper的配置,zookeeper就是为了进行集群间信息同步协助框架,把相关进程启动就可以了。首先搭建一个伪分布式的环境首先修改主机名、关闭防火墙、配置主机名和ip间的映射关...原创 2018-12-18 15:18:26 · 355 阅读 · 0 评论