Big Data
文章平均质量分 95
cnhome
Empty
展开
-
Superset搭建及其简单使用
转载 2018-05-09 11:11:04 · 1661 阅读 · 0 评论 -
How to install Hadoop distribution from Bigtop 1.2.0
转自EnvironmentCentOS 6 machines running on VM/Docker/Bare Metals, etc.If using docker, don’t run this on the docker host but on a CentOS 6 containerDeployCopy and paste the following text ...转载 2018-04-27 18:09:17 · 380 阅读 · 0 评论 -
巧用Superset大数据分析平台搞定各类图表
转自前言其实大数据图表展示的这类平台有很多,Superset是其中之一,最近有个需求对各类图表展示的开发较多,索性将工作量交给这个平台。介绍Superset的中文翻译是快船,而Superset其实是一个自助式数据分析工具,它的主要目标是简化我们的数据探索分析操作,它的强大之处在于整个过程一气呵成,几乎不用片刻的等待。 部署docker方式(推荐)do...转载 2018-05-08 10:11:21 · 6252 阅读 · 1 评论 -
给大数据分析师的一双大礼:Apache Kylin和Superset
转自分析师的挑战在大数据时代,使用传统数据处理方式已经无法满足企业大规模数据的增长,而人工智能和IoT时代的到来让处理超大规模数据,解读超大规模数据的需求更加迫在眉睫。分析和理解超大规模数据集就成为这些企业要解决的当务之急。一重礼: Apache Kylin 开源OLAP on Hadoop引擎现代企业使用联机分析处理 (OLAP) 技术来分析数据,生成报表,从而帮助业务人...转载 2018-05-08 10:55:33 · 1814 阅读 · 0 评论 -
Streaming Tweets with NiFi, Kafka, Tranquility, Druid and Superset
转自 The concept of time is at the core of all Big Data processing technologies but is particularly important in the world of data stream processing. Indeed, it is reasonable to say that the way in whi...转载 2018-05-08 13:46:47 · 486 阅读 · 0 评论 -
大数据:Hive - ORC 文件存储格式
转自ORC File文件结构 ORC的全称是(Optimized Row Columnar),ORC文件格式是一种Hadoop生态圈中的列式存储格式,它的产生早在2013年初,最初产生自Apache Hive,用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet类似,它并不是一个单纯的列式存储格式,仍然是首先根据行组分割整个表,在每一个行组内进行按列存储。ORC文件是...转载 2018-05-08 16:01:34 · 36880 阅读 · 1 评论 -
hortonworks-sandbox oozie缺少extjs的问题解决
参考资料I finally solved it by installing a third-party version of ExtJS from the following url: http://archive.cloudera.com/gplextras/misc/ext-2.2.zipThen following the steps:Stop Oozie service from ...转载 2019-01-03 16:52:37 · 572 阅读 · 0 评论