- 博客(1)
- 资源 (8)
- 收藏
- 关注
原创 读取Nutch爬取的网页内容
进入nutch的安装目录,运行命令: bin/nutch readseg -dump db/segments/20090525140014 segdb -nocontent -nofetch -nogenerate -noparse -noparsedata db/segments/20090525140014为一个segments文件夹,segdb为存放转换后的内容的文件夹
2009-05-25 15:53:00 4708
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人