![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
万里浮云
这个作者很懒,什么都没留下…
展开
-
Hive与HBase的区别与联系
二者区别Hive:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换...转载 2020-03-04 11:37:55 · 2845 阅读 · 0 评论 -
详解大数据平台架构
详解大数据平台架构https://www.jianshu.com/p/5dcda857da49原创 2020-03-04 00:41:44 · 712 阅读 · 0 评论 -
区分 hdfs hbase hive hbase适用场景
摘要: hdfs hbase hive hdoop适用场景Hive不想用程序语言开发MapReduce的朋友比如DB们,熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。注意Hive现在适合在离线下进行数据的操作,就是说不适合在挂在真实的生产环境中进行实时的在线查询或操作,因为一个字“慢”。相反起源于FaceBook,Hive在Hadoop中扮演数据仓库的角色。建立在Hado...转载 2020-03-03 23:58:16 · 431 阅读 · 0 评论 -
大数据分析中常见的大数据分析模型
大数据分析中,有哪些常见的大数据分析模型?https://www.zhihu.com/question/36360374原创 2020-02-29 23:10:12 · 1220 阅读 · 0 评论 -
数据可视化设计浅析与研究
数据可视化设计浅析与研究(一)http://www.xueui.cn/design-theory/analysis-of-data-visualization-design-1.html原创 2020-02-28 23:09:47 · 333 阅读 · 0 评论 -
大数据相关开源项目汇总
调度与管理服务Azkaban 是一款基于Java编写的任务调度系统任务调度,来自LinkedIn公司,用于管理他们的Hadoop批处理工作流。Azkaban根据工作的依赖性进行排序,提供友好的Web用户界面来维护和跟踪用户的工作流程。YARN 是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,解决了旧MapReduce框架的性能瓶颈。它的基本思想...转载 2020-02-28 22:33:26 · 1599 阅读 · 0 评论