自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我是明星的专栏

我是一只小小鸟啊,一点点往上飞啊飞。。。。。。

  • 博客(8)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

转载 Map/Reduce的GroupingComparator排序

一、背景排序对于MR来说是个核心内容,如何做好排序十分的重要,这几天写了一些,总结一下,以供以后读阅。二、准备1、hadoop版本是0.20.22、输入的数据格式(这个很重要,看清楚格式),名称是secondary.txt:[java] view plaincopyabc     123  acb     124  cbd     523  abc     

2013-10-22 16:34:01 1034

原创 mongodb java api常用方法的使用以及和spring的集成使用

本篇文章主要介绍了mongodb对应java的常用增删改查的api,以及和spring集成后mongoTemplate的常用方法使用,废话不多说,直接上代码:1.首先上需要用到的两个实体类User和Home,对应用户和家乡import java.util.List;import org.springframework.data.mongodb.core.mapping.Document

2013-10-19 11:26:35 6705

原创 hive命令参数

$HIVE_HOME/bin/hive是一个shell工具,它可以用来运行于交互或者批处理方式配置单元查询,语法如下:1. -i filename 执行脚本文件filename,会在终端上显示mapreduce的进度,执行完毕后,最后把查询结果输出到终端上,然后进入交互模式    eg:hive -i script.sql            1       jim    

2013-10-17 17:44:05 4714

原创 hive分区

一、背景1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间。3、如果需要创建有分区的表,需要在create表的时候调用可选参数partitioned by,详见表创建的语法结构。二、技术细节

2013-10-12 15:37:26 7817

转载 多map/reduce执行

学习hadoop,必不可少的就是写MapReduce程序,当然,对于简单的分析程序,我们只需一个MapReduce就能搞定,这里就不提单MapReuce的情况了,网上例子很多,大家可以百度Google一下。对于比较复杂的分析程序,我们可能需要多个Job或者多个Map或者Reduce进行分析计算。        多Job或者多MapReduce的编程形式有以下几种:1、迭代式MapR

2013-10-12 14:14:09 1926

原创 解决mysql Access denied for user 'root'@'localhost'

# mysql -uroot -pEnter password:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO)使用网上介绍的方法修改root用户的密码:# mysqladmin -uroot -p password 'newpassword'Ente

2013-10-10 10:34:14 2903

转载 mysql的安装以及和mapreduce的交互

1、MySQL安装MySQL下载地址:http://www.mysql.com/downloads/1.1 Windows平台  1)准备软件   MySQL版本:mysql-5.5.21-win32.msi  2)安装环境:   操作系统:Windows 7旗舰版  3)开始安装   第一步:双击"msi"安装文件,出现如图1.1-1界面——"MySQL安装向导"

2013-10-09 14:16:48 7386

转载 Hadoop管理员的十个最佳实践

大多数管理员都是从Apache Hadoop开始学习。笔者最开始也使用Apache版本Hadoop进行开发和部署工作,但接触到Cloudera CDH后,我发现它可以使管理员的工作更简单,不仅可以获得最新的特性和Bug修复,有时也会带来令人惊喜的性能改善。AD:2013云计算架构师峰会精彩课程曝光接触Hadoop有两年的时间了,期间遇到很多的问题,既有经典的

2013-10-08 14:48:53 929 3

hdfs-over-ftp的重构

官网的hdfs-over-ftp已经好久没有更新,还只是停留在hadoop 0.20.x,下载之后不兼容无法使用,所以对hdfs-over-ftp进行了重构,此软件支持hadoop2.0.0,其他版本还需要重新编译打jar包,zip包中附带了一个使用说明

2014-05-08

hadoop-2.0.0-cdh4.1.2-eclipse-plugin

里面包含了一个jar包:hadoop-2.0.0-cdh4.1.2-eclipse-plugin,亲测可以正常使用

2014-04-18

hadoop数据输出压缩

hadoop数据输出压缩

2012-09-14

hadoop访问数据库

使用hadoop来访问数据库,详细说明了访问数据库的原理和步骤

2012-09-14

hbase权威指南

hbase技术最权威的一个文档,详细描述了hbase的起源以及和使用

2012-09-14

hadoop之map/reduce

hadoop开发文档

2012-08-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除