大数据
文章平均质量分 83
习惯纯洁的45度仰望
每天叫醒自己的不是闹钟,而是梦想
展开
-
linux+hadoop+scala+spark
《Spark实战高手之路-从零开始》原创 2017-12-01 11:21:07 · 687 阅读 · 0 评论 -
zeppelin+kylin+hive+hbase+hadoop+sqoop解决方案之sql问题
大致说下架构,hadoop的mapreduce实现基础计算,kylin实现数据统计分析,sqoop把mysql数据同步到hive中hive和hbase服务于kylin,hive是数据仓库为kylin提供数据,hbase存放kylin生成的cube。zeppelin通过kylin提供的接口进行大数据可视化展示。1、整个过程中mysql\hive\kylin三处用到了sql,但标准不一样这是比原创 2018-01-15 10:49:32 · 2996 阅读 · 0 评论 -
kylin 2.1的坑
kylin是一款还算不错的大数据分析软件。即对表的维度进行类似笛卡尔积种情况的聚合统计。事实表A有5个字段,含有维度字段1,维度字段2,维度字段3,数值1,数值2维度字段有10个数值,维度字段2有5个数值,维度字段3有6个数值那么kylin做的事情就是对10*5*6种情况对数值1、数值2进行各种聚合统计。主要适用于数值的sum吐槽1:count,虽然记录数统计是默认自带的,但原创 2018-01-02 15:44:52 · 1528 阅读 · 0 评论 -
hadoop-java接口调用
1、java建类写方法2、打成jar包3、export HADOOP_CLASSPATH=*.jar4、命令调用% hadoop 类名 参数1 参数2 ...原创 2018-01-29 15:29:13 · 327 阅读 · 0 评论