- 博客(30)
- 问答 (1)
- 收藏
- 关注
转载 Hadoop使用心得,流程详解
<br /><br />CYD同学的Hadoop使用心得和大家分享下<br />使用hadoop的map/reduce进行分布式运算已经有一段时间了,谈下自己的心得,纯粹是自己的感受,欢迎拍砖。<br />首先是部署,在linux下的部署非常简单,随便在网上找个攻略就能搞定。关键是如何配置一个调试环境。在实验室,我是用ubuntu,直接在图形界面下用eclipse,非常方便。考虑到很多时候,linux没有图形界面,比如淘宝这种在windows下用xshell登陆开发机的情况,有必要在windows下模拟一个
2011-05-24 16:53:00 4023 2
转载 InverseMapper.class二次排序
<br />原文地址:http://bbs.chinaunix.net/thread-1650880-1-1.html<br /> <br /> <br /> <br />用一个并行计算任务显然是无法同时完成单词词频统计和排序的,这时我们可以利用 Hadoop<br />的任务管道能力,用上一个任务(词频统计)的输出做为下一个任务(排序)的输入,顺序执行两个并行计算任务。主要工作是修改代码清单3中的 run<br />函数,在其中定义一个排序任务并运行之。<br /> <br />在
2011-05-20 15:34:00 3751 1
转载 利用JavaAPI来访问HDFS的文件与目录
<br />package com.demo.hdfs;import java.io.BufferedInputStream;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStre
2011-05-19 15:22:00 9188 5
转载 hadoop 二次排序
<br />数据<br />[@zw-hadoop-master hadoop]$ hadoop fs -cat /tmp/text.txt<br />1 9<br />2 8<br />3 7<br />4 6<br />5 5<br />6 4<br />7 3<br />8 2<br />9 1<br />0 0<br />9 9<br />8 8<br />7 7<br />6 6<br />5 5<br />
2011-05-17 17:07:00 3288 1
转载 JAVA 时间差距,两个时间相差多少天,时,分,秒
<br />import java.text.DateFormat;import java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Date;/*** 时间相距* @author Ben* @version 1.0* @date 2009-10-21 16:38:51*/public class DateDistance { /**
2011-05-17 10:54:00 46549
转载 android intent和intent action大全
<br />android 中intent是经常要用到的。不管是页面牵转,还是传递数据,或是调用外部程序,系统功能都要用到intent。在做了一些intent的例子之后,整理了一下intent,希望对大家有用。由于intent内容太多,不可能真的写全,难免会有遗落,以后我会随时更新。如果你们有疑问或新的intent内容,希望交流。 <br />★intent大全: <br />1.从google搜索内容 <br />Intent intent = new Intent(); <br />intent
2011-05-11 15:31:00 1913
转载 android调用系统短信Intent时将预填接收号码
前段世界在一个应用中调用系统自带的发送短信的Intent,但是接收者的号码一直穿不过去,代码如下:Uri smsToUri = Uri.parse("smsto:123456"); Intent sendIntent = new Intent(Intent.ACTION_VIEW, smsToUri); sendIntent.putExtra("sms_body", "Hello dear world"); sendIntent.setType("vnd.android-dir/mms-sms"
2011-05-11 15:23:00 2494
转载 在android里如何代码调用系统短信发送界面
Uri smsToUri = Uri.parse("smsto://10086"); Intent mIntent = new Intent( android.content.Intent.ACTION_SENDTO, smsToUri ); startActivity( mIntent );
2011-05-11 15:19:00 4994 1
转载 Android的基本常用的短信操作
<br />1、调用系统发送短信界面(传入手机号码+短信内容) <br />2、隐藏发送短信(指定号码指定内容)(这里隐藏只是没有反写入数据库)<br /><br />3、获得收件箱接收到的短信<br /><br />4、Android屏蔽新短信通知提示信息:(ContentObserver)<br /><br />4、删除刚接收到的短信:<br /><br /> A)、带提示删除<br /><br /> B)、无新短信通知=删除短信<br /><br /><br /><br /><
2011-05-11 15:15:00 5234 1
转载 Hadoop程序中怎样用代码删除hafs中的文件和目录
<br />Configuration conf = new Configuration();String uri="hdfs://hadoop1:9000"; FileSystem fs=FileSystem.get(URI.create(uri),conf);String s="/user/root/"+ args[1];Path p=new Path(s);boolean a=fs.delete(p,true);System.out.println(a);
2011-05-11 11:19:00 7538
原创 开发 Standalone Android Java 应用程序
<br /> <br />原文地址:http://blog.csdn.net/quaful/archive/2010/12/23/6094940.aspx<br /> <br /> <br /> <br />一般来说,我们开发的 Android 应用程序都是基于 Activity 的,由 Android 系统来管理程序的生命周期;但是,有的时候,我们也想自己来控制程序的流程。例如,如果只是开发一个类似 /system/bin/pm 那样的 console 应用程序,用 Activity 就不合适了。这里我称
2011-05-08 22:59:00 1882
转载 怎么在android中动态加载一个java 类?
<br /><br />这有个DexClassLoader的例子<br />http://android.git.kernel.org/?p=platform/dalvik.git;a=blob;f=tests/071-dexfile/src/Main.java;hb=HEAD<br /> <br />String jarFile = "path/to/jarfile.jar";DexClassLoader classLoader = new DexClassLoader( jarFile,
2011-05-08 22:54:00 2532 1
转载 Android App 如何动态加载类
<br />原帖地址:http://blog.csdn.net/quaful/archive/2010/12/24/6096951.aspx<br /> <br /> <br /> <br />在 Java 里面,我们可以把一些类放到 .jar 文件里面,然后用 ClassLoader 动态加载。例如:<br /> <br />URLClassLoader ucl = URLClassLoader.newInstance(new URL[] {new URL("file:/sdcard/files/t
2011-05-08 18:09:00 1956
转载 如何对hadoop作业的某个task进行debug单步跟踪
<br /><br />对于使用hadoop进行日志分析等工作的开发者来说,相信一直都面临着一个非常头 疼的问题。那就是:对hadoop的mapreduce作业,在分布式集群上进行单个task的单步debug跟踪调试无法办到。只能在本地进行调试,然 后提交到集群中运行,但是集群中如果某个task总是失败,要对这一个task进行单步跟踪就非常困难。其实原因很简单,因为当把作业提交到hadoop 集群进行运行的时候,你事先根本就不知道那个map或者reduce的task会被分配到哪个tasktracker上执行
2011-05-06 17:34:00 2200
原创 Hadoop分布式安装
一、安装准备1、下载hadoop 0.20.2,地址:http://www.apache.org/dist/hadoop/core/hadoop-0.20.2/2、JDK版本:jdk-6u20-linux-i586.bin (必须是1.6)3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 200...
2011-05-06 10:56:53 65
原创 hdfs文件操作基本方法(1)
<br />DFSOperater.java<br /> <br />import org.apache.hadoop.conf.*;import org.apache.hadoop.fs.*;import org.apache.hadoop.hdfs.*;import org.apache.hadoop.hdfs.protocol.*;import java.util.Date;public class DFSOperater { /** * @param args *
2011-05-05 14:26:00 2898
原创 最简单HDFS读取文件
<br />public class ReadDFS { public static void main(String[] args) { Configuration conf = new Configuration(); try{ FileSystem hdfs = FileSystem.get(conf); Path inPath = new Path("/user/nodie/my22"); // FSDataInputStream d
2011-05-05 14:22:00 3189
原创 基于云计算平台的并行数据挖掘
基于云计算平台的并行数据挖掘已有 1261 次阅读 2010-5-7 14:26 |个人分类:cloud|系统分类:科研笔记采用云计算技术,实现海量数据的存储、分析、处理、挖掘,提供高可靠性、高性能的数据挖掘分析。从系统架构来讲,基于云计算的并行数据挖掘工具平台包括三个层次,依下而上为分布式计算层;数据挖掘平台层;业务应用层(1)分布式计算平台层:包括三部...
2011-05-05 11:06:18 319
原创 hadoop 现实场景
作者:hovlj_1130 | 可以任意转载, 但转载时务必以超链接形式标明文章原始出处 和 作者信息 及 版权声明http://hi.baidu.com/hovlj_1130/blog/item/619e36d436be74c950da4b2d.html场景:hadoop集群A ip: 192.168.11.*hadoop-namenode:192.168.11.Ause...
2011-05-05 11:00:24 61
原创 hadoop 通用操作
配置HDFS 配置HDFS应该是一件不难的事情。首先,我们先配好HDFS的配置文件,再对NameNode进行format操作。 配置Cluster 这里,我们假定,你已经下载了Hadoop的一个版本,并解压完毕。 Hadoop安装目录下的conf是hadoop存放配置文件的目录,里面有一些XML文件需要配置。conf/hadoop-defaults.x...
2011-05-04 15:09:47 119
原创 HDFS的JAVA接口API操作实例
20:55 2010-6-2运行环境:Hadoop.0.20.2CentOS 5.4 java version "1.6.0_20-ea"配置的是单机Hadoop环境先看下我的运行截图主要参考这篇文章http://myjavanotebook.blogspot.com/2008/05/hadoop-file-system-tutori...
2011-05-03 11:10:04 125
转载 HDFS的API对Hadoop文件系统的文件进行写入
<br /> <br />http://yjhexy.javaeye.com/blog/561720<br />可以通过FileSystem类的静态get方法来获取HDFS文件系统的实例,FileSystem的实例实现了很多对于文件操作的函数,如上次介绍的open方法,当然,FileSystem也实现了文件写入操作的函数了.我们可以通过调用create方法来在hdfs文件系统中建立一个文件,create方法返回一个FSDataOutputStream的实例,FSDataOutputStream是继承自jav
2011-05-03 11:06:00 11151
转载 Hadoop读写Hdfs系统文件
<br /><br />Hadoop读写Hdfs系统文件<br />第一,在程序添加相关引用。<br />import org.apache.hadoop.fs.FSDataInputStream;<br />import org.apache.hadoop.fs.FSDataOutputStream;<br />import org.apache.hadoop.fs.FileStatus;<br />import org.apache.hadoop.fs.FileSystem;<br />import o
2011-05-03 11:03:00 5799 1
原创 (转)MapReduce源码分析总结
原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029499.html 转者注:本来想在Hadoop学习总结系列详细解析HDFS以及Map-Reduce的,然而查找资料的时候,发现了这篇文章,并且发现caibinbupt已经对Hadoop的源代码已经进行了详细的分析,推荐大家阅读。转自http://blog.csd...
2011-05-03 04:31:31 88
原创 Hadoop学习总结:Hadoop的运行痕迹
原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029497.html Hadoop 学习总结之一:HDFS简介Hadoop学习总结之二:HDFS读写过程解析Hadoop学习总结之三:Map-Reduce入门Hadoop学习总结之四:Map-Reduce的过程解析 在使用hadoop的时候,可能遇...
2011-05-03 04:30:10 163
原创 Hadoop学习总结:Map-Reduce的过程解析
原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029496.html 一、客户端Map-Reduce的过程首先是由客户端提交一个任务开始的。提交任务主要是通过JobClient.runJob(JobConf)静态函数实现的:public static RunningJob runJob(Job...
2011-05-03 04:28:36 94
原创 Hadoop学习总结:Map-Reduce入门
原文地址:http://www.cnblogs.com/end/archive/2011/04/26/2029492.html 1、Map-Reduce的逻辑过程假设我们需要处理一批有关天气的数据,其格式如下:按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/-00...
2011-05-03 04:26:02 83
原创 hadoop学习笔记之二:MapReduce基本编程
原文地址:http://qa.taobao.com/?p=10523 引言在本系列的上篇文章中介绍了Hadoop的基本概念和架构,本文将通过一个实例演示MapReduce基本编程。在继续进行前希望能重温下前面的内容,至少理解这张图是怎么回事。实践创建maven工程并加入hadoop依赖我们选用maven来管理工程,用自己喜爱的m2eclipse插件在eclipse里创...
2011-05-03 04:24:13 57
原创 hadoop学习笔记之一:初识hadoop
原文地址:http://qa.taobao.com/?p=10514 引言最近了解到淘宝使用hadoop的项目多了起来,hadoop对于许多测试人员来说或许是个新鲜玩儿,因此,把自己之前整理的学习笔记整理发上来,希望通过此系列文章快速了解Hadoop的基本概念和架构原理,从而助于hadoop相关项目的测试理解和沟通。Hadoop简介Hadoop 是一个实现了 MapReduce 计算...
2011-05-03 04:21:03 51
原创 使用hadoop进行大规模数据的全局排序
1. Hellow hadoop~~!Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发,执行中间数据排序以及最后的汇总,期间还包含节点发现,任务的重试,故障节点替换等等等等的维护以及异常情况处理。谁叫hadoo...
2011-05-03 03:58:06 67
空空如也
有关hadoop数据导入的一些疑问
2011-05-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人