Hadoop大数据
文章平均质量分 72
Leosnow
释怀说了太多就成真不了。
展开
-
大数据组件的维护
HBase是一个建立在HDFS之上,面向列的针对结构化和半结构化数据的可伸缩、高可靠、高性能、分布式的动态数据库。Hive是一个数据仓库技术,用于查询和管理存储在分布式环境下的大数据集,通常用离线分析。Kafka是一种高吞吐量的分布式消息系统,主要用于处理活跃的流式数据Sqoop主要用于传统关系型数据库和Hadoop之间传输数据Flume是开源的海量日志收集系统。ZooKeeper集群主要负责Hadoop集群的一些数据管理问题,如命名服务、配置管理、状态同步、集群管理、队列管理、分布式锁等。...原创 2022-08-18 13:52:39 · 585 阅读 · 0 评论 -
Hadoop 完全分布式及HA高可用集群搭建
基础环境:三个节点 前提/etc/hosts master对其他节点可免密登录(包括自己) 上传jdk和hadoop包到master节点,都解包到/usr/local/src下 vim /etc/profile 末尾追加#set java environmentexport JAVA_HOME=/usr/local/src/jdkexport JRE_HOME=/usr/local/src/jreexport CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_原创 2022-04-19 18:09:09 · 2598 阅读 · 0 评论 -
HBase组件:HRegionServer无法启动,或者刚启动就挂掉
排错记录:(①HMaster存在 HRegionServer起不来②或者一会就挂掉,查日志无报错)①根据hbase-site.xml配置文件,当使用JDK8+版本时将相关信息注释掉即可(三个节点)[root@master conf]# vim hbase-env.sh②开时间同步(坑,没说要开,但其他节点最好都要有)yum -y install ntpdatentpdate cn.pool.ntp.org重新启动即可[root@master ~]# /usr/local/src原创 2022-04-19 17:50:07 · 3931 阅读 · 0 评论