自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 搭建Sqark

准备一个安装包并使用Xftp上传解压安装包(-C 是指定解压路径)tar -zxvf spark-2.4.5-bin-hadoop2.6.tgz -C /usr/local/soft3.名字太长改它名字mv spark-2.4.5-bin-hadoop2.6/ spark-2.4.53. 配置环境变量1. vim /etc/profile2.添加export SPARK_HOME=/usr/local/soft/spark-2.4.5export PATH=$SPARK_H.

2021-10-22 14:00:18 862

原创 搭建HBase(完全分布式)

一、搭建前环境Hadoopzookeeper二、开始搭建启动Hadoopstart-all.sh启动zookeeper注意:三台虚拟机都需要运行此命令启动zkServer-start.sh准备一个安装包,使用xftp上传解压到/usr/local/soft (解压到哪里看自己爱好)tar -xvf hbase-1.4.6-bin.tar.gz -C /usr/local/soft5. 配置环境变量vim /etc/profile添加:按i编辑expo

2021-10-17 09:50:43 179

原创 HBase初涉猎

一、HBase简介1.HBase是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。2.利用Hadoop HDFS作为其文件存储系统,利用Hadoop Map Reduce来处理HBase中的海量数据,利 用zookeeper作为其分布式协同服务。3、主要用来存储非结构化和半结构化的松散数据(列存NoSQL数据库)二、HBase系统架构1、Master为Region server分配region负责Region server的负载均衡发现失效的Region server并

2021-10-16 20:46:05 102

原创 Hive与传统数据库的区别及Hive的存储格式

一、 Hive与传统数据库的比较1.如图查询语言类SQL的查询语言HQL。熟悉Sql开发的开发者可以很方便的使用Hive开发。数据存储位置所有Hive的数据都是存储在HDFS中的。而数据库可以将数据存储在块设备中或本地存储文件系统中。数据格式Hive中没有定义专门的数据格式。而在数据库中,所有数据都会按照一定的组织存储。正因如此,数据库加载数据的过程比较耗时。 数据更新Hive对数据的添加、改写比较弱化,0.14以后版本支持,需要启动配置项。而数据库通常是需要经常进行修改的。

2021-09-27 21:51:24 357

原创 测试Hive之牛刀小试

1.启动HIvehive2.在HIve中创建Test1数据库create database test1;3.切换test1数据库use test1;4.创建students表create table students( id bigint comment '学生id', name string comment '学生姓名', age int comment '学生年龄', gender string comment '学生性别', clazz string

2021-09-25 19:49:29 240

原创 搭建Hive1.2.1

一、Hive搭建1.搭建前所需要的环境及我所使用的版本HadoopSQLJdk JAVA_HOME=/usr/local/soft/jdk1.8.0_171 HADOOP_HOME=/usr/local/soft/hadoop-2.7.6 HIVE_HOME=/usr/local/soft/hive-1.2.12.修改MySQL编码修改MySQL编码为UTF-8 编辑配置文件 vim /etc/my.cnf 加入以下内容 [client]

2021-09-23 21:01:53 352

原创 简述数据仓库Hive

简述数据仓库HiveHive是什么Hive是建立在Hadoop上的数据仓库基础构架。它提功了 一系列工具 可以用来数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据。同时,这个语言也允许熟悉MapReduce开发者的开发自定义的mapper 和 reduce 来处理内建的mapper 和 reduce 无法完成的复杂的分析工作。Hive是SQL解析引擎,它将SQL语句转化成M/R Jo

2021-09-21 16:54:16 110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除