自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 问答 (1)
  • 收藏
  • 关注

转载 Hadoop使用心得,流程详解

<br /><br />CYD同学的Hadoop使用心得和大家分享下<br />使用hadoop的map/reduce进行分布式运算已经有一段时间了,谈下自己的心得,纯粹是自己的感受,欢迎拍砖。<br />首先是部署,在linux下的部署非常简单,随便在网上找个攻略就能搞定。关键是如何配置一个调试环境。在实验室,我是用ubuntu,直接在图形界面下用eclipse,非常方便。考虑到很多时候,linux没有图形界面,比如淘宝这种在windows下用xshell登陆开发机的情况,有必要在windows下模拟一个

2011-05-24 16:53:00 4023 2

转载 InverseMapper.class二次排序

<br />原文地址:http://bbs.chinaunix.net/thread-1650880-1-1.html<br /> <br /> <br /> <br />用一个并行计算任务显然是无法同时完成单词词频统计和排序的,这时我们可以利用 Hadoop<br />的任务管道能力,用上一个任务(词频统计)的输出做为下一个任务(排序)的输入,顺序执行两个并行计算任务。主要工作是修改代码清单3中的 run<br />函数,在其中定义一个排序任务并运行之。<br />            <br />在

2011-05-20 15:34:00 3751 1

转载 利用JavaAPI来访问HDFS的文件与目录

<br />package com.demo.hdfs;import java.io.BufferedInputStream;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStre

2011-05-19 15:22:00 9188 5

转载 hadoop 二次排序

<br />数据<br />[@zw-hadoop-master hadoop]$ hadoop fs -cat /tmp/text.txt<br />1    9<br />2    8<br />3    7<br />4    6<br />5    5<br />6    4<br />7    3<br />8    2<br />9    1<br />0    0<br />9    9<br />8    8<br />7    7<br />6    6<br />5    5<br />

2011-05-17 17:07:00 3288 1

转载 JAVA 时间差距,两个时间相差多少天,时,分,秒

<br />import java.text.DateFormat;import java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Date;/*** 时间相距* @author Ben* @version 1.0* @date 2009-10-21 16:38:51*/public class DateDistance { /**

2011-05-17 10:54:00 46549

转载 android intent和intent action大全

<br />android 中intent是经常要用到的。不管是页面牵转,还是传递数据,或是调用外部程序,系统功能都要用到intent。在做了一些intent的例子之后,整理了一下intent,希望对大家有用。由于intent内容太多,不可能真的写全,难免会有遗落,以后我会随时更新。如果你们有疑问或新的intent内容,希望交流。  <br />★intent大全:  <br />1.从google搜索内容  <br />Intent intent = new Intent();  <br />intent

2011-05-11 15:31:00 1913

转载 android调用系统短信Intent时将预填接收号码

前段世界在一个应用中调用系统自带的发送短信的Intent,但是接收者的号码一直穿不过去,代码如下:Uri smsToUri = Uri.parse("smsto:123456"); Intent sendIntent = new Intent(Intent.ACTION_VIEW, smsToUri); sendIntent.putExtra("sms_body", "Hello dear world"); sendIntent.setType("vnd.android-dir/mms-sms"

2011-05-11 15:23:00 2494

转载 在android里如何代码调用系统短信发送界面

Uri smsToUri = Uri.parse("smsto://10086"); Intent mIntent = new Intent( android.content.Intent.ACTION_SENDTO, smsToUri ); startActivity( mIntent ); 

2011-05-11 15:19:00 4994 1

转载 Android的基本常用的短信操作

<br />1、调用系统发送短信界面(传入手机号码+短信内容) <br />2、隐藏发送短信(指定号码指定内容)(这里隐藏只是没有反写入数据库)<br /><br />3、获得收件箱接收到的短信<br /><br />4、Android屏蔽新短信通知提示信息:(ContentObserver)<br /><br />4、删除刚接收到的短信:<br /><br />      A)、带提示删除<br /><br />        B)、无新短信通知=删除短信<br /><br /><br /><br /><

2011-05-11 15:15:00 5234 1

转载 Hadoop程序中怎样用代码删除hafs中的文件和目录

<br />Configuration conf = new Configuration();String uri="hdfs://hadoop1:9000"; FileSystem fs=FileSystem.get(URI.create(uri),conf);String s="/user/root/"+ args[1];Path p=new Path(s);boolean a=fs.delete(p,true);System.out.println(a); 

2011-05-11 11:19:00 7538

原创 开发 Standalone Android Java 应用程序

<br /> <br />原文地址:http://blog.csdn.net/quaful/archive/2010/12/23/6094940.aspx<br /> <br /> <br /> <br />一般来说,我们开发的 Android 应用程序都是基于 Activity 的,由 Android 系统来管理程序的生命周期;但是,有的时候,我们也想自己来控制程序的流程。例如,如果只是开发一个类似 /system/bin/pm 那样的 console 应用程序,用 Activity 就不合适了。这里我称

2011-05-08 22:59:00 1882

转载 怎么在android中动态加载一个java 类?

<br /><br />这有个DexClassLoader的例子<br />http://android.git.kernel.org/?p=platform/dalvik.git;a=blob;f=tests/071-dexfile/src/Main.java;hb=HEAD<br /> <br />String jarFile = "path/to/jarfile.jar";DexClassLoader classLoader = new DexClassLoader( jarFile,

2011-05-08 22:54:00 2532 1

转载 Android App 如何动态加载类

<br />原帖地址:http://blog.csdn.net/quaful/archive/2010/12/24/6096951.aspx<br /> <br /> <br /> <br />在 Java 里面,我们可以把一些类放到 .jar 文件里面,然后用 ClassLoader 动态加载。例如:<br /> <br />URLClassLoader ucl = URLClassLoader.newInstance(new URL[] {new URL("file:/sdcard/files/t

2011-05-08 18:09:00 1956

转载 如何对hadoop作业的某个task进行debug单步跟踪

<br /><br />对于使用hadoop进行日志分析等工作的开发者来说,相信一直都面临着一个非常头 疼的问题。那就是:对hadoop的mapreduce作业,在分布式集群上进行单个task的单步debug跟踪调试无法办到。只能在本地进行调试,然 后提交到集群中运行,但是集群中如果某个task总是失败,要对这一个task进行单步跟踪就非常困难。其实原因很简单,因为当把作业提交到hadoop 集群进行运行的时候,你事先根本就不知道那个map或者reduce的task会被分配到哪个tasktracker上执行

2011-05-06 17:34:00 2200

原创 Hadoop分布式安装

一、安装准备1、下载hadoop 0.20.2,地址:http://www.apache.org/dist/hadoop/core/hadoop-0.20.2/2、JDK版本:jdk-6u20-linux-i586.bin (必须是1.6)3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 200...

2011-05-06 10:56:53 65

原创 hdfs文件操作基本方法(1)

<br />DFSOperater.java<br /> <br />import org.apache.hadoop.conf.*;import org.apache.hadoop.fs.*;import org.apache.hadoop.hdfs.*;import org.apache.hadoop.hdfs.protocol.*;import java.util.Date;public class DFSOperater { /** * @param args *

2011-05-05 14:26:00 2898

原创 最简单HDFS读取文件

<br />public class ReadDFS { public static void main(String[] args) { Configuration conf = new Configuration(); try{ FileSystem hdfs = FileSystem.get(conf); Path inPath = new Path("/user/nodie/my22"); // FSDataInputStream d

2011-05-05 14:22:00 3189

原创 基于云计算平台的并行数据挖掘

基于云计算平台的并行数据挖掘已有 1261 次阅读 2010-5-7 14:26 |个人分类:cloud|系统分类:科研笔记采用云计算技术,实现海量数据的存储、分析、处理、挖掘,提供高可靠性、高性能的数据挖掘分析。从系统架构来讲,基于云计算的并行数据挖掘工具平台包括三个层次,依下而上为分布式计算层;数据挖掘平台层;业务应用层(1)分布式计算平台层:包括三部...

2011-05-05 11:06:18 319

原创 hadoop 现实场景

作者:hovlj_1130 | 可以任意转载, 但转载时务必以超链接形式标明文章原始出处 和 作者信息 及 版权声明http://hi.baidu.com/hovlj_1130/blog/item/619e36d436be74c950da4b2d.html场景:hadoop集群A ip: 192.168.11.*hadoop-namenode:192.168.11.Ause...

2011-05-05 11:00:24 61

原创 hadoop 通用操作

配置HDFS             配置HDFS应该是一件不难的事情。首先,我们先配好HDFS的配置文件,再对NameNode进行format操作。    配置Cluster    这里,我们假定,你已经下载了Hadoop的一个版本,并解压完毕。    Hadoop安装目录下的conf是hadoop存放配置文件的目录,里面有一些XML文件需要配置。conf/hadoop-defaults.x...

2011-05-04 15:09:47 119

原创 HDFS的JAVA接口API操作实例

20:55 2010-6-2运行环境:Hadoop.0.20.2CentOS 5.4 java version "1.6.0_20-ea"配置的是单机Hadoop环境先看下我的运行截图主要参考这篇文章http://myjavanotebook.blogspot.com/2008/05/hadoop-file-system-tutori...

2011-05-03 11:10:04 125

转载 HDFS的API对Hadoop文件系统的文件进行写入

<br /> <br />http://yjhexy.javaeye.com/blog/561720<br />可以通过FileSystem类的静态get方法来获取HDFS文件系统的实例,FileSystem的实例实现了很多对于文件操作的函数,如上次介绍的open方法,当然,FileSystem也实现了文件写入操作的函数了.我们可以通过调用create方法来在hdfs文件系统中建立一个文件,create方法返回一个FSDataOutputStream的实例,FSDataOutputStream是继承自jav

2011-05-03 11:06:00 11151

转载 Hadoop读写Hdfs系统文件

<br /><br />Hadoop读写Hdfs系统文件<br />第一,在程序添加相关引用。<br />import org.apache.hadoop.fs.FSDataInputStream;<br />import org.apache.hadoop.fs.FSDataOutputStream;<br />import org.apache.hadoop.fs.FileStatus;<br />import org.apache.hadoop.fs.FileSystem;<br />import o

2011-05-03 11:03:00 5799 1

原创 (转)MapReduce源码分析总结

原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029499.html   转者注:本来想在Hadoop学习总结系列详细解析HDFS以及Map-Reduce的,然而查找资料的时候,发现了这篇文章,并且发现caibinbupt已经对Hadoop的源代码已经进行了详细的分析,推荐大家阅读。转自http://blog.csd...

2011-05-03 04:31:31 88

原创 Hadoop学习总结:Hadoop的运行痕迹

原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029497.html   Hadoop 学习总结之一:HDFS简介Hadoop学习总结之二:HDFS读写过程解析Hadoop学习总结之三:Map-Reduce入门Hadoop学习总结之四:Map-Reduce的过程解析  在使用hadoop的时候,可能遇...

2011-05-03 04:30:10 163

原创 Hadoop学习总结:Map-Reduce的过程解析

原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029496.html  一、客户端Map-Reduce的过程首先是由客户端提交一个任务开始的。提交任务主要是通过JobClient.runJob(JobConf)静态函数实现的:public static RunningJob runJob(Job...

2011-05-03 04:28:36 94

原创 Hadoop学习总结:Map-Reduce入门

原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029492.html  1、Map-Reduce的逻辑过程假设我们需要处理一批有关天气的数据,其格式如下:按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/-00...

2011-05-03 04:26:02 83

原创 hadoop学习笔记之二:MapReduce基本编程

原文地址:http://qa.taobao.com/?p=10523  引言在本系列的上篇文章中介绍了Hadoop的基本概念和架构,本文将通过一个实例演示MapReduce基本编程。在继续进行前希望能重温下前面的内容,至少理解这张图是怎么回事。实践创建maven工程并加入hadoop依赖我们选用maven来管理工程,用自己喜爱的m2eclipse插件在eclipse里创...

2011-05-03 04:24:13 57

原创 hadoop学习笔记之一:初识hadoop

 原文地址:http://qa.taobao.com/?p=10514 引言最近了解到淘宝使用hadoop的项目多了起来,hadoop对于许多测试人员来说或许是个新鲜玩儿,因此,把自己之前整理的学习笔记整理发上来,希望通过此系列文章快速了解Hadoop的基本概念和架构原理,从而助于hadoop相关项目的测试理解和沟通。Hadoop简介Hadoop 是一个实现了 MapReduce 计算...

2011-05-03 04:21:03 51

原创 使用hadoop进行大规模数据的全局排序

1.   Hellow hadoop~~!Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发,执行中间数据排序以及最后的汇总,期间还包含节点发现,任务的重试,故障节点替换等等等等的维护以及异常情况处理。谁叫hadoo...

2011-05-03 03:58:06 67

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除