自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (31)
  • 收藏
  • 关注

转载 hive的元数据存储在mysql后,报错的解决方法

hive的元数据存储在mysql后,报错的解决方法!  最近,因为工作的需要,一直在研究hadoop系统。许多分析工作都将通过hive来解决,所以特将所碰到的问题和解决方案,陆续整理出来,既做为回顾又供需要的朋友参考!    因为要实现多人开发Hive,所以需要将hive的元数据存储在mysql。配置完成后,配置之前hive中创建的数据表在show tables

2013-05-22 23:10:21 1001

转载 hive开发环境搭建体验

最近为了规范hadoop团队的开发流程,所以已经在Eclipse里进行相关的hive开发工作。但是目前在运行hive的时候,有几个问题需要注意下:第一个问题:直接运行CliDriver类报错,信息如下:WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apach

2013-05-22 14:26:39 991

转载 Hadoop : MapReduce中的Shuffle和Sort分析

转载自:http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763104c90354501de2b3fdcda107cd6924a84642c1a0131a8ec302267558e9a61375ff21c41e9f7357731012ba3de95c81cd2facf68699f27453146c115468d4e&p=c949d11885cc42a8

2013-05-22 09:57:44 872

转载 关于HIVE的SELECT count(*) 优化

刚刚下载了一份HIVE的最新源码。印象最深的是HIVE将表的大小作为了元数据保存在了关系数据库中。譬如在老版本中执行如下的语句:from base insert overwrite table user select * ;你会发现日志的末尾会有 “999 ROWD LOADED INTO TABLE USER” 的字样代表有999条目记录保存在了user表

2013-05-17 16:00:42 8362 1

转载 GettingStarted EclipseSetup (官网资料:hive+eclipse设置)

After checking out the source code run the following command from the top-level directory: $ ant clean package eclipse-filesNow open up Eclipse and do the following:File->Import->Gene

2013-05-16 13:00:56 830

转载 maven setting 文件

<settings xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/settings-1.0.

2013-05-15 23:24:03 963

转载 Java操作Hbase进行建表、删表以及对数据进行增删改查,条件查询

1、搭建环境  新建JAVA项目,添加的包有:   有关Hadoop的hadoop-core-0.20.204.0.jar   有关Hbase的hbase-0.90.4.jar、hbase-0.90.4-tests.jar以及Hbase资源包中lib目录下的所有jar包 2、主要程序 Java代码  package com.wujintao.hbas

2013-05-12 18:11:43 950

转载 使用Hive读取Hbase中的数据

原地址:http://victorzhzh.iteye.com/blog/972406第一步,启动hadoop,命令:./start-all.sh第二步,启动hive,命令:./hive --auxpath /home/dream-victor/hive-0.6.0/lib/hive_hbase-handler.jar,/home/dream-victor/hi

2013-05-12 01:11:40 1221

转载 手动安装cloudera cdh4.2 hadoop + hbase + hive(三)

本文主要记录手动安装cloudera Hive cdh4.2.0集群过程,环境设置及Hadoop、HBase安装过程见上篇文章。安装hivehive安装在desktop1上,注意hive默认是使用derby数据库保存元数据,这里替换为postgresql,下面会提到postgresql的安装说明,并且需要拷贝postgres的jdbc jar文件导hive的lib目录下。上

2013-05-12 00:13:24 3727 3

转载 手动安装cloudera cdh4.2 hadoop + hbase + hive(二)

安装HBaseHBase安装在desktop3、desktop4、desktop6、desktop7、desktop8机器上。上传文件 上传hbase-0.94.2-cdh4.2.0.zip到desktop3上,先在desktop3上修改好配置文件,在同步到其他机器上。hbase-site.xml[root@desktop3 conf]# pwd/opt/

2013-05-12 00:12:05 2492 1

转载 手动安装cloudera cdh4.2 hadoop + hbase + hive(一)

安装版本hadoop-2.0.0-cdh4.2.0hbase-0.94.2-cdh4.2.0hive-0.10.0-cdh4.2.0jdk1.6.0_38安装前说明安装目录为/opt检查hosts文件关闭防火墙设置时钟同步使用说明安装hadoop、hbase、hive成功之后启动方式为:启动dfs和mapreduce desktop1上执

2013-05-12 00:10:23 3703 3

转载 关于mapreduce 的 shuffle ,partition,combiner

之前在学习mapreduce 的过程中一直不能够完全准确的理解shuffle,partition,combiner的作用,其实简单来说:shuffle:  是描述着数据从map端传输到reduce端的过程,而且我们知道的是hadoop的集群环境中,大部分map task和reduce task是在不同的node上执行,主要的开销是网络开销和磁盘IO开销,因此shuffle的主要作用相当于是

2013-05-06 10:45:55 1208

转载 Ant 设置http代理

转自:http://my.oschina.net/hidennis/blog/55852Ant 设置http代理0人收藏此文章,我要收藏发表于5个月前(2012-05-02 15:58) , 已有121次阅读 共0个评论在编译Harmony的时候,经常需要去fetch依赖,但是服务器本身不能够上外网,因此只能通过代理的方式去下载这些依赖~

2013-05-03 16:43:02 1380

原创 hive使用小技巧-如何往Hive SQL中传入参数

很多SQL需要重复执行,可能是每天执行一次,而需要修改的只是SQL中的日期字段,这种情况下可以使用 参数代入使用的方式$ hive -d key1=value1 -d key2=value -d key3=value3 ...复制代码例子-1:hive -d shell_date_1='20120425' -d shell_date_

2013-05-02 14:10:46 13996

原创 设置root密码

在向大家详细介绍Linux mysql之前,首先让大家了解下Linux mysql,然后全面介绍Linux mysql,希望对大家有用。1. Linux mysql安装:$ yum install mysql-server2. Linux mysql修改root密码:$ mysqladmin -u root password your_new_passwd3. 启动

2013-05-02 10:44:41 618

腾讯深度学习平台(译)

腾讯深度开发平台翻译文档,介绍深度学习平台架构等,有很好的学习价值,值得大家学习一下

2014-08-14

MFS文件系统使用手册.pdf

MFS文件系统使用手册,新手学习还是很不错的,大家可以学习一下

2014-01-09

基于事件的 NIO 多线程服务器(源码)

基于事件的 NIO 多线程服务器(源码) 可以根据博客中的描述对照学习

2013-07-22

VMware-ESXI-5.0.0 key

VMware-ESXI-5.0.0 key

2013-01-10

Oracle知识库

1.Oracle知识 2.DBA 3.Exp vs Imp 4.SQL技巧 5.Oracle错误 6.Oracle初学者入门 7.Oracle安装与删除 8.Oracle安全性问题 9.Oracle系统设置,优化,链接 10.索引,序列,快照,数据库链路,触发器 11.Oracle及其其他数据库比较 12.linux vs unix 13.Develop 2000

2012-10-24

Hadoop入门手册

高手整理的Hadoop学习资料 对于新手学习相当适合

2012-10-15

WIN7安装Oracle 步骤以及问题解决

记录了 WIN7安装oracle 的步骤 解决win7安装不上oracle的问题 大家可以参考

2012-10-11

《Hadoop开发者 》1-3期刊

《Hadoop开发者 》 帮你认识和学习hadoop 里面讲解还是比较详细的,对于初识者还是比较有帮助 推荐大家好好看看

2012-10-11

虚拟化与云计算PDF

虚拟化与云计算 电子工业出版社 电子扫描版 帮助大家认识虚拟化与云计算 是入门级书籍 推荐大家翻阅一下

2012-10-10

easyui 帮助文档

jQuery-easyui api 中文文档 简单方便 chm的

2012-10-10

Hadoop配置手册

Linux下配置hadoop 环境配置,以及运行操作的全部过程

2012-09-11

Java 优化编程

Java程序设计风格 内存管理 Java核心类与性能优化 JNI程序设计及性能优化 类与接口 JSP与Servlet性能优化 开发高性能的EJB应用 JMS性能优化 JDBC性能优化 软件结构,设计模式及性能优化

2012-08-07

开发中的sql积累

在开发过程中对处理sql,以及sql各种函数 还有各种关键字的积累

2012-08-07

Oracle调优心得

外部的性能问题 : CPU 内存 网络 行的重新排序 SQL 语句的调优 调整 Oracle 的竞争 调整 Oracle 的排序操作 表格和索引存储参数设置的要求总结

2012-08-07

HTTP协议详解

非常详细的解读HTTP协议的各个方面的用途,帮助开发人员认识清楚协议的原理,保证开发的准确和明确性

2012-07-09

Hadoop权威指南 中文版 第二版完全版

全方位的介绍Hadoop这一高性能处理海量数据集的理想工具

2012-05-12

JMS_ActiveMQ交流学习

JMS学习指导讲解PPT,ActiveMQ学习PPT 以及对JMS实现的研究

2012-02-21

Java实现几种常见的排序算法

Java实现几种常见的排序算法,包括插入排序,二分法排序,堆排序,选择排序,冒泡排序等等,常用的都设计到了。

2012-02-21

kettle 中的集群详解

kettle集群 技术详解,可以解决kettle中的集群技术问题!!

2011-08-01

IBM WebSphere MQ入门教程

IBM WebSphere MQ 学习分享

2011-08-01

kettle 应用简单java例子1

关于kettle的开源开发 基于java的例子,实现表之间的同步。

2011-08-01

学习ext中文帮助文档

关于ext的帮助文档,对于ext初学者极有帮助可以查询你所需要的东西

2010-08-08

企业人事管理系统的设计

实现了企业人事的管理各个方面的功能,对人事的管理更加方便和高效

2010-08-07

实现普通局域网聊天的软件

实现了局域网下的聊天功能,跟QQ界面功能相似

2010-08-07

小区物业管理系统的实现

针对各个小区的智能化管理,做出的小区物业管理系统,实现了住户信息管理,投诉管理,车辆管理,缴费管理,管理员管理,陌生人管理等功能。

2010-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除