最近研究了一下大数据的知识,对MapReduce writableComparator有一点理解,写出来记录一下。
查阅了一下HadoopAPI的文档:
该类并非被多数的衍生类所实现,其具体的子类为WritableComparator,
多数情况下是作为实现Writable接口的类的内置类,提供序列化字节的比较。如下图说所示:BooleanWritable, BytesWritable, ByteWritable, org.apache.hadoop.io.serializer.DeserializerComparator, DoubleWritable, FloatWritable, IntWritable, JavaSerializationComparator, LongWritable, LongWritable, MD5Hash, NullWritable, RecordComparator, Text, UTF8,都实现了RawComparator,作为其内部类。
Writable是Hadoop的序列化格式,Hadoop定义了这样的一个Writable接口。 一个类要支