重头来过的菜鸡-CSDN博客

原创搭建Sqark

准备一个安装包并使用Xftp上传解压安装包(-C 是指定解压路径)tar -zxvf spark-2.4.5-bin-hadoop2.6.tgz -C /usr/local/soft3.名字太长改它名字mv spark-2.4.5-bin-hadoop2.6/ spark-2.4.53. 配置环境变量1. vim /etc/profile2.添加export SPARK_HOME=/usr/local/soft/spark-2.4.5export PATH=$SPARK_H.

2021-10-22 14:00:18 927

原创搭建HBase（完全分布式）

一、搭建前环境Hadoopzookeeper二、开始搭建启动Hadoopstart-all.sh启动zookeeper注意：三台虚拟机都需要运行此命令启动zkServer-start.sh准备一个安装包，使用xftp上传解压到/usr/local/soft (解压到哪里看自己爱好)tar -xvf hbase-1.4.6-bin.tar.gz -C /usr/local/soft5. 配置环境变量vim /etc/profile添加：按i编辑expo

2021-10-17 09:50:43 234

原创 HBase初涉猎

一、HBase简介1.HBase是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。2.利用Hadoop HDFS作为其文件存储系统，利用Hadoop Map Reduce来处理HBase中的海量数据，利用zookeeper作为其分布式协同服务。3、主要用来存储非结构化和半结构化的松散数据（列存NoSQL数据库）二、HBase系统架构1、Master为Region server分配region负责Region server的负载均衡发现失效的Region server并

2021-10-16 20:46:05 126

原创 Hive与传统数据库的区别及Hive的存储格式

一、 Hive与传统数据库的比较1.如图查询语言类SQL的查询语言HQL。熟悉Sql开发的开发者可以很方便的使用Hive开发。数据存储位置所有Hive的数据都是存储在HDFS中的。而数据库可以将数据存储在块设备中或本地存储文件系统中。数据格式Hive中没有定义专门的数据格式。而在数据库中，所有数据都会按照一定的组织存储。正因如此，数据库加载数据的过程比较耗时。数据更新Hive对数据的添加、改写比较弱化，0.14以后版本支持，需要启动配置项。而数据库通常是需要经常进行修改的。

2021-09-27 21:51:24 397

原创测试Hive之牛刀小试

1.启动HIvehive2.在HIve中创建Test1数据库create database test1;3.切换test1数据库use test1;4.创建students表create table students( id bigint comment '学生id', name string comment '学生姓名', age int comment '学生年龄', gender string comment '学生性别', clazz string

2021-09-25 19:49:29 277

原创搭建Hive1.2.1

一、Hive搭建1.搭建前所需要的环境及我所使用的版本HadoopSQLJdk JAVA_HOME=/usr/local/soft/jdk1.8.0_171 HADOOP_HOME=/usr/local/soft/hadoop-2.7.6 HIVE_HOME=/usr/local/soft/hive-1.2.12.修改MySQL编码修改MySQL编码为UTF-8 编辑配置文件 vim /etc/my.cnf 加入以下内容 [client]

2021-09-23 21:01:53 397

原创简述数据仓库Hive

简述数据仓库HiveHive是什么Hive是建立在Hadoop上的数据仓库基础构架。它提功了一系列工具可以用来数据提取转化加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。同时，这个语言也允许熟悉MapReduce开发者的开发自定义的mapper 和 reduce 来处理内建的mapper 和 reduce 无法完成的复杂的分析工作。Hive是SQL解析引擎，它将SQL语句转化成M/R Jo

2021-09-21 16:54:16 145

weixin_48840566的博客