- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Hadoop 实现WritableComparable的类
首先要了解hadoop的序列化 序列化(serialization): 序列化指的是将结构化对象转为字节流以便于通过网络进行传输或写入持久存储的过程。反序列化指的是将字节流转为一系列结构化对象的过程。 序列化用于:进程间通信与持久存储。 RPC序列化建议的特性 1.紧凑(Compact)即方便网络传输,充分利用存储空间 2.快速(
2013-11-17 20:25:17 766
原创 Hadoop学习笔记---1.wordcount程序的剖析
前些天一直都把时间花在了装hadoop上,今天终于运行了自己的首个hadoop程序,现在将程序和自己对程序的理解贴出来和大家分享 import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop
2013-11-09 21:31:55 528
原创 HDFS命令行操作
HDFS文件操作命令 1、列出HDFS文件 bin/hadoop fs -ls 在HDFS中未带参数的-ls命令没有返回任何值,它默认返回HDFS的“home”目录下的内容,在HDFS中,没有当前目录这一概念,也没有cd命令。 2、列HDFS目录下某个文档中的文件 bin/hadooop fs -ls in 3、上传文件到HDFS bin/hadoop fs -put test1 t
2013-11-09 17:14:46 945
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人