- 博客(4)
- 资源 (9)
- 收藏
- 关注
转载 Spark的日志配置
转:http://blog.csdn.net/stark_summer/article/details/46929481在测试spark计算时,将作业提交到yarn(模式–master yarn-cluster)上,想查看print到控制台这是imposible的,因为作业是提交到yarn的集群上,so 去yarn集群上看日志是很麻烦的,但有特别想看下print的信息,方便调试或者别的目的在Spar
2016-08-31 09:54:10 317
原创 数据字典与元数据
数据字典数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明 1. 在传统的软件工程方法中,数据字典用的比较多,数据字典就是对软件所需要使用的数据进行编号说明,它是配合数据流图使用的,在数据流图中,数据字典是不同业务活动间传递的信息,比如,业务活动“起草”“审核”,就可能是流转的文件,那么这个文件具体
2016-08-31 09:50:41 16102 1
转载 数据仓库的模型设计
数据仓库的模型设计A. 数据建模方法论数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。模型设计分为三个阶段:1,概念模型对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。一般划分为8个主题域:客户、服务、服务使用、账务、结算、资源、客服、营销为什么要划分主题域?划分主题域,是根据业务的应用和
2016-08-24 16:36:44 611
转载 Oozie-4.0.0-CDH 安装部署
转:http://blog.csdn.net/u010967382/article/details/41355953下载解压下载安装过程需要的相关文件:oozie4.0.0安装包http://archive.cloudera.com/cdh5/cdh/5/oozie-4.0.0-cdh5.2.0.tar.gzext2.2包ht
2016-08-02 13:31:26 748
KafkaOffsetMonitor-assembly-0.2.0
2016-01-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人