第一次写自定义类型的sequence File。
发现必须继承两个文件一个是sequenceFileinputformat,一个是sequenceFileRecordReader。
发现虽然Hadoop中有arraywritable类型,但是很难使用。
无论是哪种inputformat,其读取key/value对时,无论是以byte[],还是String ,都无法将value还原回array。
如果用object,还是会降低效率。
最好都用Text.
第一次写自定义类型的sequence File。
发现必须继承两个文件一个是sequenceFileinputformat,一个是sequenceFileRecordReader。
发现虽然Hadoop中有arraywritable类型,但是很难使用。
无论是哪种inputformat,其读取key/value对时,无论是以byte[],还是String ,都无法将value还原回array。
如果用object,还是会降低效率。
最好都用Text.