Apache Mahout Cookbook 书中 Chapter 2. Using Sequence Files – When and Why? 对于序列化过程介绍的比较清楚
转换工具类:
mahout seqdirectory:将文本文件转成SequenceFile文件,SequenceFile文件是一种二制制存储的key-value键值对,对应的源文件是org.apache.mahout.text.SequenceFilesFromDirectory.java
源码分析:http://blog.csdn.net/zmc_happy_blog/article/details/25630311
查看转化结果:
mahout seqdumper:将SequenceFile文件转成文本形式,对应的源文件是org.apache.mahout.utils.SequenceFileDumper.java