自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (9)
  • 收藏
  • 关注

转载 Hive2.0新特性

转载自:http://www.36dsj.com/archives/60604Apache Hive2.0的新特性介绍 雪姬 2016-09-07 9:24:15 Hadoop 评论(0)Hive 是一个基于 Hadoop 文件系统之上的数据仓库架构。它为数据仓库的管理提供了许多功能:数据 ETL (抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。

2017-03-31 19:12:41 4354

转载 Two-phase commit(2PC) 协议介绍 (分布式数据一致性操作)

2PC协议在多数据中心,多路写的情况下,保证数据一致性而设计的协议。   2PC思想比较简单,是一个失败,全体不成功;如果成功,就没有一个失败的简单逻辑,实现简单。      本文讲述其大概流程,client提交数据到N个节点上,其中一个节点选为协调员coordinator,其他作为cohorts(partcipant)。2PC做了一些假设:1、  每个节点都有稳定存储(s

2017-03-31 17:20:00 1285

原创 Hive学习笔记

为分区表动态添加分区的语法:insert overwrite table t_sz_part partition(country) --指定t_sz_part是按照那个列分区的,select se.id,se.name,se.name --需要插入的列的信息,以及第二个se.name 为匹配t_sz_

2017-03-31 10:54:04 1944

转载 SQL truncate 、delete与drop区别

转载:http://www.cnblogs.com/8765h/archive/2011/11/25/2374167.html相同点:1.truncate和不带where子句的delete、以及drop都会删除表内的数据。 2.drop、truncate都是DDL语句(数据定义语言),执行后会自动提交。不同点:1. truncate 和 delete 只删除数据

2017-03-18 10:12:32 585

转载 多维数据库&关系型数据库详细介绍

转载自:http://bbs.pinggu.org/thread-4164420-1-1.html多维数据库&关系型数据库详细介绍                                                                                                         【数据库】

2017-03-15 19:58:24 17457

原创 oracle查询技巧以及函数使用

确定一段数据连续值得开始点和结束点如下面的nba每年获得总冠军的队伍数据:统计连续获得总冠军的队伍名称,以及年份的开始和结束点代码如下:with cte as (select row_number() over(order by nvl(a.Y, 9999)) id, a.*, b.tname t1, b.Y Y1

2017-03-15 19:25:53 1939

原创 rollup分析函数

表的初始数据:使用rollup进行汇总之后的数据:select t.first_name,sum(t.salary) from t_test1 tgroup by rollup(t.first_name)可以改写为:select nvl(t.first_name,'total'),sum(t.salary) from t_test1 tgroup

2017-03-15 17:51:21 21794

转载 图解列数据库存储

转载自:http://blog.csdn.net/dc_726/article/details/41143175最近看到一篇很好资料,里面三言两语配上几个图就把列式存储(Column-based Storage)讲明白了,牛啊!最喜欢的就是这种浅显易懂就把背景知识讲得明明白白,而不是长篇大论的讲概念。1 为什么要按列存储列式存储(Columnar or colu

2017-03-11 11:46:05 449

转载 oracle物化视图

转载自:http://blog.csdn.net/suncrafted/article/details/4300358一、------------------------------------------------------------------------------------------物化视图是包括一个查询结果的数据库对像,它是远程数据的的本地副本,或者用来生成基于数据表求

2017-03-11 08:54:42 238

cdh-hive2.1.1版本orc格式表读取包数组越界替换包

cdh-hive2.1.1版本orc文件读取数据报错替换包: Caused by: java.lang.ArrayIndexOutOfBoundsException: 7 at org.apache.orc.OrcFile$WriterVersion.from(OrcFile.java:145) at org.apache.orc.impl.OrcTail.getWriterVersion(OrcTail.java:74) at org.apache.orc.impl.ReaderImpl.<init>(ReaderImpl.java:385) at org.apache.hadoop.hive.ql.io.orc.ReaderImpl.<init>(ReaderImpl.java:62) at org.apache.hadoop.hive.ql.io.orc.OrcFile.createReader(OrcFile.java:89) at org.apache.hadoop.hive.ql.io.orc.VectorizedOrcInputFormat.getRecord

2022-05-18

cdh6.3.2离线安装包.txt

包含cdh安装的各种资源,mysql,oracle-jdk,及cdh的安装包,CM的安装包

2021-08-18

flink1.13.2集成到cdh集群安装包

包含flink1.13.2针对cdh6.2-6.4版本的编译包 parcel,parcel.sha manifect.json FLINK_ON_YARN.下载后可直接添加到cdh集群中

2021-08-18

flink1.13.2集成cdh重新编译包.txt

flink1.13.2集成cdh重新编译包.txt

2021-08-18

cdh6.2.0 离线安装包.txt

cloudera manager 离线安装包

2021-08-10

spark-rdd-APi

内容根据spark rdd.scala和ParRDDFunctions.scala源码中rdd顺序整理,包含rdd功能解释。对熟悉spark rdd很有用

2017-12-14

c++primer第五版答案

包含c+primer第五版前九章的所有习题答案,以及所有章节的最权威的代码,非常的给力的

2015-07-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除