- 博客(4)
- 收藏
- 关注
原创 hadoop(伪分布式)上的spark和Scala安装与配置
在搭建spark和Scala前提下,必需安装好hive和java,和 Hadoop的伪分布式 哦。
2024-04-26 16:11:38 657
原创 Hive 组件安装配置
将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。(1)使用 root 用户,将 Hive 安装包 /opt/software/apache-hive-2.0.0-bin.tar.gz 路解压到/usr/local/src 路径下。(2)本地安装 MySQL 数据库(账号 root,密码 Password123$), 软件包在/opt/software/mysql-5.7.18 路径下。
2024-04-09 16:35:21 1031
原创 关于Hadoop
1)Presto:开源分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB级。Presto可以处理多数据源,是一款基于内存计算的MPP架构查询引擎。2)Kudu:与HBase类似的列存储分布式数据库,能够提供快速更新和删除数据的功能,是一款既支持随机读写,又支持OLAP分析的大数据存储引擎。3)Impala:高效的基于MPP架构的快速查询引擎,基于Hive并使用内存进行计算,兼顾ETL功能,具有实时、批处理、多并发等优点。
2024-03-15 15:44:49 1107 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人