Bigdata
文章平均质量分 66
BoomLee
boomlee.com ,大数据开发的百宝箱。RHCE认证,AWS SAP 认证,大数据工程师,从事医疗大数据行业
展开
-
Impala
交互式查询工具 Imapala第1部分 Impala 概念1.1 Impala 是什么Impala是Cloudera提供的一款开源的针对HDFS和HBASE中的PB级别数据进行交互式实时查询(Impala速度快),Impala是参照谷歌的新三篇论文当中的Dremel实现而来,其中旧三篇论文分别是(BigTable,GFS,MapReduce)分别对应我们即将学的HBase和已经学过的HDFS以及MapReduce。Impala最大卖点和最大特点就是快速,Impala中文翻译是高角羚羊。1.2 Im原创 2022-05-04 14:37:08 · 1035 阅读 · 0 评论 -
BI分析工具 Apache Superset 安装部署
1 Superset概述https://superset.apache.orghttps://github.com/apache/supersetsuperset是一个开源的、现代的、轻量级BI分析工具,支持多种数据源、拥有丰富的图表展示形式、支持自定义仪表盘。superset能够对接常用的大数据分析工具,如Hive、Kylin、Durid等,支持自定义仪表盘,可作为数仓的可视化工具。2 Superset安装部署superset是由python语言开发的web应用,要求python3.6环境原创 2022-04-14 15:58:56 · 1382 阅读 · 0 评论 -
Windows 安装Spark 环境
1.下载地址http://spark.apache.org/downloads.html2.配置环境解压到指定目录添加环境变量SPARK_HOME内容为解压的目录C:\Mysoftware\Dev\spark-2.3.3-bin-hadoop2.7\Path 里 添加%SPARK_HOME%\bin;%SPARK_HOME%\sbin验证...原创 2019-04-01 13:45:58 · 396 阅读 · 0 评论