- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 hdfs操作
1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Large Data Set)的应用处理带来
2012-11-26 22:00:14 694
转载 eclipse下运行hadoop
1.获取mapreduce tool pluginhadoop用0.20.2,注意0.20.1中没有eclipse-hadoop的plugin,3. 将 hadoop-*-eclipse-plugin.jar 拷贝到 eclipse 文件夹下的/plugins 文件夹里4. 在/home/YourName/testin 下新建 2 个文本文件,里面各输入若干单词5. 启动 Ecli
2012-11-26 17:32:19 463
转载 JAVA多线程实现方式
1.JAVA多线程实现方式JAVA多线程实现方式主要有三种:继承Thread类、实现Runnable接口、使用ExecutorService、Callable、Future实现有返回结果的多线程。其中前两种方式线程执行完后都没有返回值,只有最后一种是带返回值的。2.继承Thread类实现多线程继承Thread类的方法尽管被我列为一种多线程实现方式,但Thread本质上也是实现了Runn
2012-11-19 15:17:13 384
转载 Ubuntu-环境配置文件
Ubuntu-环境配置文件注:本文提及的内容适用于ubuntu 10.10Ubuntu里面的环境配置文件:(1)/etc/enviroment 是系统的环境变量。(2)/etc/profile: 是所有用户的环境变量。当用户第一次登录时,该文件被执行. 并从/etc/profile.d目录的配置文件中搜集shell的设置。(3)/etc/bashrc: 为每一个
2012-11-06 11:42:49 326
转载 Hadoop进行分布式并行编程
用Hadoop进行分布式并行编程(二)程序实例与分析Hadoop 是一个实现了MapReduce 计算模型的开源分布式并行编程框架,借助于Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。在本文中,详细介绍了如何针对一个具体的并行计算任务,基于Hadoop 编写程序,如何使用 IBM MapReduce Tools 在 Eclipse 环境中编
2012-11-03 23:06:53 482
原创 hadoop官网的资料
http://hadoop.apache.org/docs/r0.19.2/cn/mapred_tutorial.html#%E7%9B%AE%E7%9A%84http://hadoop.apache.org/docs/r0.19.2/cn/mapred_tutorial.html#%E7%9B%AE%E7%9A%84
2012-11-03 19:50:55 278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人