自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 zookeeper3.4.6部署(集群模式)最全保姆级教程

Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。本文将从使用者角度详细介绍 Zookeeper 的安装和配置文件中各个配置项的意义,以及分析 Zookeeper 的典型的应用场景(配置文件的管理、集群管理、同步锁、Leader 选举、队列管理等),用 Java 实现它们并给出示例代码。系统环境:CentOS 7集群环境: 虚拟机。

2024-08-16 19:19:05 703

原创 hadoop2.7安装配置详述&&安装前预备工作简章

#、安装前预备工作准备:准备3台虚拟机,或者3台服务器。虚拟机:网络模式:NAT 模式。内存硬盘根据个人情况分配。#.1、配置时钟同步#.1.1、配置自动时钟同步该项需要在3个节点都配置。使用 Linux 命令配置[root@master1 ~]$ crontab -e该命令是 vi 编辑命令,按 i 进入插入模式,按 Esc,然后键入:wq 保存退出键...

2019-04-22 14:19:08 470

原创 数据仓库架构简述与设计

一、数据仓库是什么数据仓库是面向主题的 集成的 相对稳定的 反映历史变化的数据集合;是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。二、数据仓库建设目的收集海量数据要用于访问 需要以各个方面方便地对数据进行切片及切块 业务人员需要方便的获...

2019-03-10 18:14:03 746

原创 从大数据研发的角度解决org.apache.hadoop.security.AccessControlException: Permission denied: user=***,不需修改集群配置文件

前言:        该异常的解决方法在网上确实已经很多了,但是楼主们都没有考虑到一个问题么?那就是身为大数据研发团队的我们,有权限轻易的去修改hadoop集群的配置文件么?就算有权限修改,万一耦合度较高的文件被修改,我们要去哭着求运维帮我们擦屁股么?很显然小编这篇小短文是在不动运维配置好的配置文件的基础上,解决远程提交hadoop任务出现的AccessControlException,跟...

2018-09-18 10:57:03 9147 6

原创 使用sparkSession读取mac上的.csv文件出现的乱码问题解决方案

如题小编学习spark的时候电脑是windows系统,spark版本是2.2.0,但是工作了换成了mac,在工作的时候不免踩些没有踩过的坑。Windows系统下使用以下方式读取本机的.csv文件是没问题的(前提是字段以’,’隔开,行用’\n’隔开)。SparkSession ss = SparkSession.builder().master("local[*]").appName(...

2018-09-18 09:48:57 1033

原创 HBase 基本介绍和设计原则

hbase 全面介绍一、简介hbase是bigtable的开源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。与hadoop一样,Hbase

2018-01-17 15:27:13 2771

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除