Big Data
文章平均质量分 78
寒-江
这个作者很懒,什么都没留下…
展开
-
Spark简介与基本术语
一、Spark简介与优点: Spark 是专为大规模数据处理而设计的开源、快速、通用的计算引擎。可以使用Java、Scala、Python、R 和 SQL 等语言调用API来执行spark 。Spark可以在Hadoop YARN、Apache Mesos 和独立集群管理器上运行。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。Spark借鉴Hadoop Map原创 2021-06-24 17:16:07 · 563 阅读 · 2 评论 -
数据仓库(data warehouse)与商务智能开发工具简介
数据仓库(data warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持 经营管理中的决策制定过程。所谓主题,是指用户使用数据仓库进行决策时所关心的重点方面。数据仓库内的信息是按主题进行组织的,而不是象业务支撑系统那样是按照业务功能进行组织的。所谓集成,是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的原创 2013-09-18 17:30:41 · 6685 阅读 · 0 评论 -
BOE(BusinessObjects Enterprise)介绍及用友商业智能实例分析
Business Objects 是全球领先的商务智能(BI)软件公司的产品套件,Business Objects XI 为报表、查询和分析、绩效管理以及数据集成提供了最完善、最可靠的平台。我们的 EIM 解决方案提供了数据整合,数据质量管理,元数据管理,以及生命周期管理产品,使您的数据更加可信。2003年我们推出了 BusinessObjects Enterprise 6,这是业内第原创 2013-09-18 16:16:08 · 1872 阅读 · 0 评论 -
什么是ODS(Operational Data Store)
什么是ODS?ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。ODS是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。Kimball关于ODS的定义(>):–是原创 2013-09-18 16:55:30 · 6490 阅读 · 0 评论 -
这5种必知的大数据处理框架技术,你的项目到底应该使用其中的哪几种
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。本文将介绍大数据系统一个最基本的组件:处理框架。处理框架负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据。数据的计算则是指从大量单一数据点中提转载 2016-10-24 15:21:44 · 9062 阅读 · 2 评论