大数据与云计算
文章平均质量分 62
bluebelfast
语音图像视频处理研究达人。
展开
-
两种分布式数据交互式处理解决方案Prestosql VS Ignite
以下介绍两种分布式数据交互式处理解决方案。这两种方案都能在不需要ETL的基础上实现数据的交互式处理。1.Prestosql第一种是采用经典的数据联合查询引擎PrestoSQL而非PrestoDB。 Prestosql主要提供分布式的数据查询引擎,并不直接提供存储组件,而是依赖第三方数据库作为存储组件。Presto查询引擎是一个传统的Master-Slave的架构,由一个Coordinator节点,一个Discovery Server节点,多个Worker节点组成,Discovery Server原创 2020-11-30 17:50:26 · 784 阅读 · 0 评论 -
Spark 应用程序两种java编程提交方式
通常的方式提交spark程序是是通过spark的submit程序实现,例如在linux系统中执行./spark-submit 提交自定义的spark应用程序。但是很多时候我们需要通过程序的方式提交spark应用程序。这里提供两类通过java程序动态提交spark,其中一种是streamsets中提交spark程序的方式。第一种方式:通过SparkSubmit.main()方法提交...原创 2019-02-12 15:19:22 · 1877 阅读 · 0 评论 -
mapreduce 缺陷的理性回归
转至:http://www.cnblogs.com/chinacloud/archive/2010/12/03/1895366.html这篇文章是由databasecolumn的几个数据库大牛写的,简要的介绍了MapReduce以及将其与现代数据库管理系统进行了对比,并指出了一些不足之处。本文纯属学习性翻译,从多方面来了解MapReduce,不代表完全赞同原文的观点。请读者也辩证的转载 2015-04-08 14:23:03 · 1783 阅读 · 0 评论 -
MapReduce 简单实例理解
转自:http://blog.csdn.net/richerg85/article/details/19616559什么是Map/Reduce,看下面的各种解释:(1)MapReduce是hadoop的核心组件之一,hadoop要分布式包括两部分,一是分布式文件系统hdfs,一部是分布式计算框,就是mapreduce,缺一不可,也就是说,可以通过mapreduce很容易在hadoop平台上转载 2015-04-08 13:56:10 · 856 阅读 · 0 评论 -
openstack horizon CSS 离线 修改
Openstack horizon 的CSS修改中遇到的问题解决办法。原创 2015-03-31 09:57:19 · 2440 阅读 · 0 评论 -
使用Storm实现实时大数据分析
转至:http://blog.csdn.net/hguisu/article/details/8454368转载 2014-06-19 10:19:29 · 970 阅读 · 0 评论 -
Mondrian 架构
Mondrian架构的官网翻译。其中省略了MDX介绍和MOLAP,ROLAP介绍。Mondrian的OLAP系统由4层组成,参见下图。从终端用户到数据中心内核,四层架构分别是:展现层(presentation layer)、维度层(dimensional layer)、星层(star layer)和存储层。翻译 2014-06-17 15:47:49 · 2006 阅读 · 0 评论 -
大数据时代的新BI系统架构发展趋势
商业智能(BI,Business Intelligence),它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。本文分析了BI系统与大数据分析结合的趋势和软件架构方案。原创 2014-05-12 11:44:11 · 5063 阅读 · 0 评论 -
teiid数据联邦解决方案
虚拟数据库(Virtual Database–VDB) 是将一个或多个物理数据源组合起来以提供更简单的数据集成解决方案,它提供了包含组件的容器,这些组件用来集成不同数据源的数据,并通过一致的 API 来访问它们。这些物理数据源包括: JDBC 数据源、CSV 文本文件、数据表,甚至可以是 Web services。这种技术被称为是“数据联邦” -Data federation。数据联邦技术转载 2014-04-29 09:59:57 · 1789 阅读 · 1 评论