- 博客(14)
- 资源 (51)
- 收藏
- 关注
转载 浅谈数据仓库建设中的数据建模方法
转载自:https://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0803zhousb/ 所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有
2016-10-24 15:16:21 281
原创 数据仓库各种概念
元数据 1:从操作型环境向数据仓库环境转换而建立的元数据,它包含了数据源的各种属性以及转换时的各种属性 2:用来与多维模型和前端工具建立映射
2016-10-24 15:05:30 330
转载 数据仓库设计总结
转载自:http://blog.csdn.net/map_lixiupeng/article/details/42296087 数据仓库之前的文章也说过已经从支持战略决策到支持战略决策和战术决策。对应战术是基本是现在企业对应数据价值的最大的挖掘,战术可以是局部数据的战术和全局数据的战术。 ok,说到这里我们建设数据仓库的目的也就明确了,简单来说就是支持数据挖掘+数据统计。数
2016-10-24 14:56:50 939
转载 当当elastic-job开源项目
转载自:http://mt.sohu.com/20151105/n425394221.shtml 一、为什么需要 作业(定时任务)? 作业即定时任务。一般来说,系统可使用消息传递代替部分使用作业的场景。两者确有相似之处。可互相替换的场景,如队列表。将待处理的数据放入队列表,然后使用频率极短的定时任务拉取队列表的数据并处理。这种情况使用消息中间件的推送模式可更好的处理实时性数据。而且基
2016-10-20 12:13:16 3777
转载 分布式调度框架TBSchedule
转载自:https://my.oschina.net/chaun/blog/653266 摘要: TBSchedule是一款非常优秀的高性能分布式调度框架,本文是作者结合多年使用TBSchedule的经验,在研读三遍源码的基础上完成。期间作者也与阿里空玄有过不少技术交流,并非常感谢空玄给予的大力支持。另外,作者写这篇文章的目的一是出于对TBSchedule的一种热爱,二是现在是一个资源共享、
2016-10-20 12:12:30 1784
转载 clover分布式任务调度系统
转载自:https://my.oschina.net/ghostmanyue/blog/375344 摘要: clover分布式任务调度系统 1、clover分布式调度介绍 clover分布式任务调度是完全使用Java技术自主开发 特点如下: 1、防单点故障 2、job可部署多台,但任务调度时,只有一台参执行。如果一台下线, clover选择其他已在zookee
2016-10-20 12:10:03 1113
转载 数据仓库专题(1)-数据仓库生命周期模型
转载自:http://blog.csdn.net/hadoopdevelop/article/details/45132611 一、前言 工作内容的变更,导致重新回到数据仓库模型的架构和设计,于是花点时间比较系统的回顾数据仓库建模和系统建设的知识体系,记录下来,作为笔记吧。 二、模型 无论数据仓库技术如何变化,从RDBMS到NoSQL,从传统技术到大数据,其实只是实现技术手段的
2016-10-18 14:46:56 573
转载 数据仓库模型设计
A. 数据建模方法论 数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。 模型设计分为三个阶段: 1,概念模型 对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。 一般划分为8个主题域: 客户、服务、服务使用、账务、结算、资源、客服、营销 为什么要划分主题域? 划分主题域,是根据业务的应用和需要来划分的,是用来达到数据与业务紧耦合的目的。 2,逻辑模型 对概念模型
2016-10-18 11:54:50 427
转载 数据仓库设计架构(1)
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用: 从图中可以看出数据仓库的
2016-10-18 11:38:40 321
转载 数据平台任务与调度设计
背景 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任务存在依赖关系,一张简单的任务依赖图如下: 目前各业务的数据任务基本都是靠Crontab定时调度,各个
2016-10-18 10:22:40 2153
转载 TCP三次握手连接及seq和ack号的正确理解
三次握手Three-way Handshake 一个虚拟连接的建立是通过三次握手来实现的 1. (B) –> [SYN] –> (A) 假如服务器A和客户机B通讯. 当A要和B通信时,B首先向A发一个SYN (Synchronize) 标记的包,告诉A请求建立连接. 注意: 一个 SYN包就是仅SYN标记设为1的TCP包(参见TCP包头Resources). 认识到这点很重要,只有当A受到
2016-09-28 16:49:15 495
转载 kafka深度解析
背景介绍 Kafka简介 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条消息的传输支持Kafka Server间的消息分区,及分布式消费,同时保证每个partition内的消息顺序传输同时支持离线数据
2016-09-27 22:52:20 380
JSP应用开发源代码
2007-09-02
《JSP语法基础》CHM
2007-09-02
手把手教你spring hibernate sturts配置与开发
2007-09-02
UML软件工(中文版)
2007-09-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人