自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (19)
  • 收藏
  • 关注

原创 nifi 1.7.1 安全集群设置+用户创建(Kerberos 配置 )

系统环境及软件版本 CentOS7 JDK1.8.0_91 Nifi-1.7.1 Kerberos5  zookeeper3.4.5 nifi-toolkit-1.7.1 集群信息:host_name IP service server 192.0.0.230 Kerberos5 Server, Nifi ...

2018-09-04 21:11:06 1692 1

转载 Hadoop 之上的数据建模 - Data Vault 2.0

对比传统的基于 RDBMS 之上的数据仓库和商业智能项目,尝试着说说,Hadoop 之上的数据仓库,从ETL, 数据存储,到分析展现。重点围绕数据建模方面做分析,因为这是本文的重点,介绍一份新的数据建模方式 Data Vault 2.0.ETL 最基本的构建来自于 转换和工作流。工作流,作用是规划一条完整的数据转换流。转换,是 ETL 最中心的组件。可以用 MapReduce 来完成,...

2018-10-08 17:27:54 1116

原创 Linux下用rm删除的文件的恢复方法

对于rm,很多人都有惨痛的教训。我也遇到一次,一下午写的程序就被rm掉了,幸好只是一个文件,第二天很快又重新写了一遍。但是很多人可能就不像我这么幸运了。本文收集了一些在Linux下恢复rm删除的文件的方法,给大家作为参考。  首先,最好的方法是避免这个问题,以下是几点建议:  1、rm -rf误操作的后果是可怕的,rm -f也要三思而行,不能轻易使用。  2、做好数据备份。  3、...

2018-09-05 17:05:53 109541 2

原创 Oracle 分析,分组函数 group by 高级用法 grouping sets,rollup和cube区别

Oracle的GROUP BY语句除了最基本的语法外,还支持ROLLUP和CUBE语句。如果是ROLLUP(A, B, C)的话,首先会对(A、B、C)进行GROUP BY,然后对(A、B)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),则首先会对(A、B、C)进行GROUP BY,然后依次是(A、B)...

2018-09-05 17:01:39 1550

原创 Teradata 日期类型转换(特殊方式)

Teradata 日期类型转换(特殊方式)

2015-07-30 09:56:45 15961

kafka+flume 实时采集oracle数据到hive中.docx

讲述如何采用最简单的kafka+flume的方式,实时的去读取oracle中的重做日志+归档日志的信息,从而达到日志文件数据实时写入到hdfs中,然后将hdfs中的数据结构化到hive中。

2020-08-11

apache-airflow-1.10.3-bin.tar.gz

Airflow是一个可编程,调度和监控的工作流平台,基于有向无环图(DAG),airflow可以定义一组有依赖的任务,按照依赖依次执行。airflow提供了丰富的命令行工具用于系统管控,而其web管理界面同样也可以方便的管控调度任务,并且对任务运行状态进行实时监控,方便了系统的运维和管理。

2019-08-06

nifi-1.9.2-source-release.zip

Apache NiFI 1.9.2版本资源库 nifi-1.9.2-source-release.zip

2019-08-06

nifi-toolkit-1.9.2-bin.tar.gz

nifi-toolkit-1.9.2-bin.tar.gz Apache NiFI 授权配置工具包

2019-08-06

apache-tez-0.8.3-src.tar.gz

Tez是Apache开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output等,这样,这些分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些控制程序组装后,可形成一个大的DAG作业。总结起来,Tez有以下特点: (1)Apache二级开源项目(源代码今天发布的) (2)运行在YARN之上 (3) 适用于DAG(有向图)应用(同Impala、Dremel和Drill一样,可用于替换Hive/Pig等

2019-08-06

apache-tez-0.9.0-bin.tar.gz

Tez是Apache开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffle、Sort、Merge、Processor和Output等,这样,这些分解后的元操作可以任意灵活组合,产生新的操作,这些操作经过一些控制程序组装后,可形成一个大的DAG作业。总结起来,Tez有以下特点: (1)Apache二级开源项目(源代码今天发布的) (2)运行在YARN之上 (3) 适用于DAG(有向图)应用(同Impala、Dremel和Drill一样,可用于替换Hive/Pig等)

2019-08-06

apache-storm-2.0.0-src.tar.gz

稳定版本的flink软件,apache-storm-2.0.0-src.tar.gz,测试通过可以。

2019-08-06

airflow dag之间调用方法.docx

airflow触发器可以一个dag中同时触发一个或者多个子dag,也可在子触发了的dag中在触发一个或者多个dag。

2019-06-04

hadoop2.2+hbase0.96+hive0.12安装整合详细高可靠文档及经验总结

hadoop2.2+hbase0.96+hive0.12安装整合详细高可靠文档及经验总结

2019-03-07

flume+kafka+storm搭建

flume+kafka+storm搭建 详细讲解大数据的消息平台的搭建。

2019-03-07

oracle数据泵倒入导出资料--全

oracle数据泵倒入导出资料,全面的说明了oracle导入导出的方法和方案

2018-09-05

nifi操作文档-官方

nifi最权威的官方文档,要想查询最新的配置请仔细阅读此文档

2018-09-05

nifi1.7.1安全集群设置

介绍了nifi1.7.1集群的搭建情况,解决现在网络上都是老版本nifi的配置文档对新版本不兼容的问题

2018-09-04

大数据BI架构方案

诠释了企业级大数据数据仓库的BI架构方案和模型设计的心得

2018-09-04

海量数据处理-hive数据仓库

海量数据处理-hive数据仓库 很好的讲解的大数据海量数据处理的数据仓库模型建设

2018-09-04

PowerDesigner15.1汉化

PowerDesigner15.1汉化文件

2013-05-22

Shell脚本编程详解-吐血共享

Shell脚本编程详解-吐血共享,绝对值得你下载的文件。

2013-04-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除