2013年05月_小桥

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载 hive的元数据存储在mysql后,报错的解决方法

hive的元数据存储在mysql后,报错的解决方法！最近，因为工作的需要，一直在研究hadoop系统。许多分析工作都将通过hive来解决，所以特将所碰到的问题和解决方案，陆续整理出来，既做为回顾又供需要的朋友参考！因为要实现多人开发Hive，所以需要将hive的元数据存储在mysql。配置完成后，配置之前hive中创建的数据表在show tables

2013-05-22 23:10:21 1001

转载 hive开发环境搭建体验

最近为了规范hadoop团队的开发流程，所以已经在Eclipse里进行相关的hive开发工作。但是目前在运行hive的时候，有几个问题需要注意下：第一个问题：直接运行CliDriver类报错，信息如下：WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apach

2013-05-22 14:26:39 991

转载 Hadoop : MapReduce中的Shuffle和Sort分析

转载自：http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763104c90354501de2b3fdcda107cd6924a84642c1a0131a8ec302267558e9a61375ff21c41e9f7357731012ba3de95c81cd2facf68699f27453146c115468d4e&p=c949d11885cc42a8

2013-05-22 09:57:44 872

转载关于HIVE的SELECT count(*) 优化

刚刚下载了一份HIVE的最新源码。印象最深的是HIVE将表的大小作为了元数据保存在了关系数据库中。譬如在老版本中执行如下的语句：from base insert overwrite table user select * ;你会发现日志的末尾会有 “999 ROWD LOADED INTO TABLE USER” 的字样代表有999条目记录保存在了user表

2013-05-17 16:00:42 8362 1

转载 GettingStarted EclipseSetup （官网资料：hive+eclipse设置）

After checking out the source code run the following command from the top-level directory: $ ant clean package eclipse-filesNow open up Eclipse and do the following:File->Import->Gene

2013-05-16 13:00:56 830

转载 maven setting 文件

<settings xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/settings-1.0.

2013-05-15 23:24:03 963

转载 Java操作Hbase进行建表、删表以及对数据进行增删改查，条件查询

1、搭建环境新建JAVA项目，添加的包有: 有关Hadoop的hadoop-core-0.20.204.0.jar 有关Hbase的hbase-0.90.4.jar、hbase-0.90.4-tests.jar以及Hbase资源包中lib目录下的所有jar包 2、主要程序 Java代码 package com.wujintao.hbas

2013-05-12 18:11:43 950

转载使用Hive读取Hbase中的数据

原地址：http://victorzhzh.iteye.com/blog/972406第一步，启动hadoop，命令：./start-all.sh第二步，启动hive，命令：./hive --auxpath /home/dream-victor/hive-0.6.0/lib/hive_hbase-handler.jar,/home/dream-victor/hi

2013-05-12 01:11:40 1221

转载手动安装cloudera cdh4.2 hadoop + hbase + hive（三）

本文主要记录手动安装cloudera Hive cdh4.2.0集群过程，环境设置及Hadoop、HBase安装过程见上篇文章。安装hivehive安装在desktop1上，注意hive默认是使用derby数据库保存元数据，这里替换为postgresql，下面会提到postgresql的安装说明，并且需要拷贝postgres的jdbc jar文件导hive的lib目录下。上

2013-05-12 00:13:24 3727 3

转载手动安装cloudera cdh4.2 hadoop + hbase + hive（二）

安装HBaseHBase安装在desktop3、desktop4、desktop6、desktop7、desktop8机器上。上传文件上传hbase-0.94.2-cdh4.2.0.zip到desktop3上，先在desktop3上修改好配置文件，在同步到其他机器上。hbase-site.xml[root@desktop3 conf]# pwd/opt/

2013-05-12 00:12:05 2492 1

转载手动安装cloudera cdh4.2 hadoop + hbase + hive（一）

安装版本hadoop-2.0.0-cdh4.2.0hbase-0.94.2-cdh4.2.0hive-0.10.0-cdh4.2.0jdk1.6.0_38安装前说明安装目录为/opt检查hosts文件关闭防火墙设置时钟同步使用说明安装hadoop、hbase、hive成功之后启动方式为：启动dfs和mapreduce desktop1上执

2013-05-12 00:10:23 3703 3

转载关于mapreduce 的 shuffle ，partition，combiner

之前在学习mapreduce 的过程中一直不能够完全准确的理解shuffle，partition，combiner的作用，其实简单来说：shuffle：　　是描述着数据从map端传输到reduce端的过程，而且我们知道的是hadoop的集群环境中，大部分map task和reduce task是在不同的node上执行，主要的开销是网络开销和磁盘IO开销，因此shuffle的主要作用相当于是

2013-05-06 10:45:55 1208

转载 Ant 设置http代理

转自：http://my.oschina.net/hidennis/blog/55852Ant 设置http代理0人收藏此文章,我要收藏发表于5个月前(2012-05-02 15:58) , 已有121次阅读共0个评论在编译Harmony的时候，经常需要去fetch依赖，但是服务器本身不能够上外网，因此只能通过代理的方式去下载这些依赖~

2013-05-03 16:43:02 1380

原创 hive使用小技巧-如何往Hive SQL中传入参数

很多SQL需要重复执行，可能是每天执行一次，而需要修改的只是SQL中的日期字段，这种情况下可以使用参数代入使用的方式$ hive -d key1=value1 -d key2=value -d key3=value3 ...复制代码例子-1：hive -d shell_date_1='20120425' -d shell_date_

2013-05-02 14:10:46 13996

原创设置root密码

在向大家详细介绍Linux mysql之前，首先让大家了解下Linux mysql，然后全面介绍Linux mysql，希望对大家有用。1. Linux mysql安装：$ yum install mysql-server2. Linux mysql修改root密码：$ mysqladmin -u root password your_new_passwd3. 启动

2013-05-02 10:44:41 618

腾讯深度学习平台（译）

腾讯深度开发平台翻译文档，介绍深度学习平台架构等，有很好的学习价值，值得大家学习一下

2014-08-14

MFS文件系统使用手册.pdf

MFS文件系统使用手册，新手学习还是很不错的，大家可以学习一下

2014-01-09

基于事件的 NIO 多线程服务器（源码）

基于事件的 NIO 多线程服务器（源码）可以根据博客中的描述对照学习

2013-07-22

VMware-ESXI-5.0.0 key

2013-01-10

Oracle知识库

1.Oracle知识 2.DBA 3.Exp vs Imp 4.SQL技巧 5.Oracle错误 6.Oracle初学者入门 7.Oracle安装与删除 8.Oracle安全性问题 9.Oracle系统设置，优化，链接 10.索引，序列，快照，数据库链路，触发器 11.Oracle及其其他数据库比较 12.linux vs unix 13.Develop 2000

2012-10-24