自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (19)
  • 收藏
  • 关注

原创 hive函数 -- split 字符串分割函数

hive字符串分割函数split(str, regex) - Splits str around occurances that match regexTime taken: 0.769 seconds, Fetched: 1 row(s)返回值为一个数组例1:split('a,b,c,d',',')得到的结果:["a","b","c","d"] 当然,我们也可

2014-01-23 19:03:16 264955 2

原创 hive的几种文件格式

hive文件存储格式1.textfiletextfile为默认格式存储方式:行存储磁盘开销大 数据解析开销大压缩的text文件 hive无法进行合并和拆分2.sequencefile二进制文件,以的形式序列化到文件中存储方式:行存储可分割 压缩一般选择block压缩优势是文件和hadoop api中的mapfile是相互兼容的。3.rcfile

2014-01-20 14:31:51 19734

原创 hive 小文件的合并 hive.merge.mapredfiles

起因:最近仓库里面新建了一张分区表,数据量大约是12亿行,分区比较多,从2008年7月开始 一天一个分区。配置了一个任务 对这个表进行group by 的时候 发现启动了2800多个maps .执行的时间也高大10分钟。然后我在hdfs文件里面看到 这个表的每个分区里面都有20多个小文件,每个文件都不大 300KB--1MB 之前的hive的参数:hive.merg

2014-01-03 16:15:04 13436

原创 hive函数 -- asin

反正弦函数asin(x) - returns the arc sine of x if -1asin(x)定义域 [-1,1]  x在其它区间的话 得到的值是null值域  [-pi/2,pi/2]实例: asin(-1) = -pi/2asin(1)=pi/2

2014-01-02 18:52:40 1704

hadoop-0.20.2-cdh3u6

hadoop-0.20.2-cdh3u6 cloudera

2013-09-04

hadoop-0.20.2-cdh3u4

hadoop-0.20.2-cdh3u4 clouera

2013-09-04

hive-0.10.0

0.10.0 支持Hadoop 0.20.x, 0.23.x.y, 1.x.y, 2.x.y 要是需要0.11.0 可以@ 我,文件太大 上传不上来。

2013-09-04

hive-0.8.1

0.8.1 支持Hadoop0.20.1 and 0.20.2

2013-09-04

深入理解MySQL核心技术(中文PDF)

《深入理解MySQL核心技术》:从公共可用性的意义上讲,MySQL源代码是开放源代码,但如果对其不了解,则实质上,它对于您来说是封闭的。MysQL开发团队的前成员Sasha Pachev通过《深入理解MySQL核心技术》给出了MySQL 5的全面指南,揭示了这一强大数据库的内部运作。您将直奔MySQL核心技术,了解各种数据结构和各种方便的功能的运作情况,了解如何添加新的存储引擎和配置选项等。 《深入理解MySQL核心技术》从结构概况讲起,在这一部分解释了MysQL的不同组件是如何协同工作的。接着将学习设置有效的可编译代码副本的步骤,然后使用基本架构添加自己的配置变量和存储引擎。

2013-03-22

hbase-0.90.5.tar.gz

hbase-0.90.5.tar.gz是hbase众多版本中的一种。

2012-12-18

wampserver2.2e

Windows系统下的Apache+Mysql+PHP,一组常用来搭建动态网站或者服务器的开源软件

2012-12-10

hadoop-0.20.2安装包

hadoop-0.20.2安装包 具体的安装步骤在博客里面已经写出。

2012-12-10

hbase-0.94.0安装包

hbase-0.94.0 可以匹配 hadoop-1.0.3来进行安装

2012-11-30

hbase-0.20.6安装包

hbase-0.20.6 可以和 hadoop-0.20.2匹配安装

2012-11-30

zookeeper 3.4.3安装包

zookeeper主要用来解决分布式集群中应用系统的一致性问题,它能提供基于类似于文件系统的目录节点树方式的数据存储。除了数据存储,它还可以用来维护和监控你存储的数据的状态变化。

2012-11-30

infobright-4.0.6-0-x86_64-ice

infobright ,一个基于mysql的数据仓库系统实现,它已经是很多开源或商用BI系统的底层存储引擎。

2012-11-27

X-Win32 2012 安装文件

X-Win32 2012是最新版的X-Win32 是一个可以在windows用窗口模式来访问linux的工具 在安装oracle的时候常常会用得到

2012-11-06

redis安装包

redis-2.4.16 REmote DIctionary Server(Redis) 是一个由Salvatore Sanfilippo写的key-value存储系统。Redis提供了一些丰富的数据结构,包括 lists, sets, ordered sets 以及 hashes ,当然还有和Memcached一样的 strings结构.Redis当然还包括了对这些数据结构的丰富操作。

2012-10-23

hadoop 1.0.3安装包

hadoop安装包 版本是1.0.3 具体的安装步骤已经在博客里面写出

2012-10-22

Hadoop权威指南

Hadoop权威指南 HIVE HBASE ZOOKEEP pdf格式的

2012-10-16

hive-0.9.0

hive-0.9.0 是一个安装好了的程序包 在安装好hadoop和mysql的机器上面解压了 配置了就可以直接使用、

2012-09-19

su-3.0.5-efgh-signed

su-3.0.5-efgh-signed.zip

2012-09-05

PG88IMG.zip

进HBOOT它会自动读取这个名字的文件 刷机前刷这个是为了刷BOOT和RECOVERY

2012-09-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除