自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

maixia24的专栏

https://github.com/xiaofateng/

  • 博客(10)
  • 资源 (16)
  • 收藏
  • 关注

原创 Mapreduce 读hbase

在tasker中设置conf.set("hbase.mapred.outputtable", "user_feature_news_forever_interest_topic");

2013-12-12 10:57:46 660

原创 经过多方努力 解决了ubuntu grub启动的问题 root命令找不到

win7 ubuntu双系统 ,后装windows会覆盖ubuntu启动文件我的情况较为复杂主要参考http://www.cnblogs.com/uptownBoy/articles/2041631.html引用加自己总结在Linux中,GRUB的配置中的安装和写入硬盘的MBR;grub-install /dev/hdagrub>root=(hd0,1)

2013-12-06 23:28:25 13884 1

原创 ubuntu启动问题

http://hi.baidu.com/3feiyu/item/df763ed8cc29753a49e1dd23http://www.2cto.com/os/201208/146630.htmlhttp://whuyinpeng.blog.163.com/blog/static/1738971272010106105035428/http://www.linuxidc.

2013-12-03 18:23:38 838

原创 inputSplit.java分析

/** * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE file * distributed with this work for additional information * regarding

2013-12-03 15:52:45 1202

原创 hadoop源码分析 jobsplit

ClusterMetrics.java类: Status information on the current state of the Map-Reduce cluster. * Mapreduce集群的当前状态 * 提供给client如下信息: * 集群大小 * 黑名单和过期的tracker * 集群的容量 * 当前Map reduce占用 * 当前运行的map

2013-12-03 15:51:43 797

原创 Hadoop源码分析之Id.java

ID.java  接口, implements WritableComparable  是 jobId taskId TaskAttemptID的基类JobId.java   * jobid是job的唯一不变的代表。jobid包括两部分,第一部分代表jobtracker的唯一,对于集群安装来说,这个字符串是 * jobtracker的开始时间 对于本地设置来说,他就是本地 

2013-12-03 15:46:10 604

原创 jobcontrol类

*  这个类包括一系列Mapreduce jobs和它的依赖 *  它通过根据状态 把job放到不同的表里面,跟踪jobs的状态, *  当一个job被添加进来 一个组的唯一标示ID 被分配给这个job。 *   *  这个类有一个线程,当job准备好的时候,提交job,监控运行的job的状态,并且依据他们的依赖job状态,更新job的状态。 *  这个类提供挂起 恢复 停止线

2013-12-03 13:03:10 1092

原创 Job源码分析

/** * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE file * distributed with this work for additional information * regarding

2013-12-01 17:12:18 2480

原创 JobContext源码分析

/** * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE file * distributed with this work for additional information * regarding

2013-12-01 16:30:44 2650

原创 Mapreduce 工作过程

jobTracker是一个程序,他的主要类是Jobracker。同理,tasktracker

2013-12-01 16:29:59 625

(12)使用数据分区优化join

数据分区 设计RDD的Partitioner

2015-06-10

(10)KeyValue对RDDs(二)

(10)KeyValue对RDDs(二)

2015-06-10

(9)KeyValue对RDDs(一)

KeyValue对RDDs介绍 创建KeyValue对RDDs KeyValue对RDDs的操作

2015-06-10

(8)RDDs的特性

RDDs的血统关系图 RDDs的延迟计算 RDD.persist()

2015-06-10

(7)RDDs基本操作之Actions

RDDs基本操作之Actions

2015-06-10

(6)RDDs基本操作之Transformations

Transformations介绍 逐元素transformations 集合运算

2015-06-10

(5)RDDs介绍

RDDs介绍 RDDs的创建方法 Scala的基础知识

2015-06-10

(3)Spark开发环境搭建

使用Scala+IntelliJ IDEA+Sbt搭建开发环境

2015-06-10

(2)Spark基础知识

Spark下载 Spark的Shells Spark的核心概念

2015-06-10

(1)Spark简介

从bigdatastudy.cn下载的讲义

2015-06-10

perl-base_5.14.2-6ubuntu2.4_amd64

mysql安装时候遇到依赖问题,这是需要的包。 详情见: http://blog.csdn.net/maixia24/article/details/43410093

2015-02-02

hadoop-eclipse-plugin-1.2.1.jar

hadoop eclipse 插件,编译环境 hadoop1.2.1+ eclipse 版本 Version: Kepler Service Release 1 在我的ubuntu下亲测可用

2013-10-27

advanced rest client json文件

advanced rest client 需要加载的json文件

2013-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除