进入nutch的安装目录,运行命令:
bin/nutch readseg -dump db/segments/20090525140014 segdb -nocontent -nofetch -nogenerate -noparse -noparsedata
db/segments/20090525140014为一个segments文件夹,segdb为存放转换后的内容的文件夹。
进入nutch的安装目录,运行命令:
bin/nutch readseg -dump db/segments/20090525140014 segdb -nocontent -nofetch -nogenerate -noparse -noparsedata
db/segments/20090525140014为一个segments文件夹,segdb为存放转换后的内容的文件夹。