大数据
文章平均质量分 91
frankzero353
这个作者很懒,什么都没留下…
展开
-
Java开源BI商业智能工具
Pentaho Pentaho商业智能套件提供企业级报表制作、分析、数据挖掘、数据集成与工作流功能。还可以利用其灵活与完整的基础框架来构建自定义的BI应用套件。 更多Pentaho信息 SpagoBI 商务智能套件SpagoBI提供一个基于J2EE的框架用于管理BI对象如报表、OLAP分析、仪表盘、记分卡以及数据挖掘模型等。它提供的BI管理器能够控制、校验、验证与分发...原创 2015-02-02 14:25:30 · 186 阅读 · 0 评论 -
大数据学习资源
http://dongxicheng.org/recommend/2015-02-03 13:41:55 · 86 阅读 · 0 评论 -
开源日志系统比较
1. 背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦; (2) 支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统; (3) 具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩展。 ...原创 2015-02-03 13:46:25 · 107 阅读 · 0 评论 -
HDFS详解
【一】HDFS简介HDFS的基本概念1.1、数据块(block)HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据块的大小,并不占用整个数据块存储空间。-------------------------...原创 2015-02-03 14:08:10 · 112 阅读 · 0 评论