- 博客(3)
- 收藏
- 关注
转载 Nutch2.2.1 笔记三 : 从Nutch脚本执行来看Nutch的内部执行过程
网上大部分的Nutch资料都是以前相对老的版本的一些介绍,其中介绍启动Nutch大多数是用如下命令 : bin/nutchcrawlurls-topN10-depth1000 bin/nutch文件是一个shell脚本,我们在STS里面打开它可以观看它的代码, 实际...
2014-07-28 16:54:00 124
转载 Nutch2.2.1 笔记二 : Nutch2.2.1 + Mysql 配置,调试
Nutch2.x 使用gora做数据抽象层,底层的数据存储可以支持Mysql,HBase,Cassandra等,而1.x是基于HDFS的。Nutch2.x官方推荐的是和HBase结合,不过这里我们先配置Nutch2.2.1和Mysql运行,因为Mysql查询起来更加直观,难...
2014-07-25 17:56:00 173
转载 Nutch2.2.1 笔记一 : 环境准备,将Nutch导入到STS/Eclipase
Nutch开发最好在linux环境下进行,省心,可以避免hadoop在windows平台上的一些问题,这里我用的是ubuntu 13.04 32位桌面版,用的是vmware 镜像,方便,不用安装,下载后直接可以用vmware打开 镜像下载地址:http://www.traffi...
2014-07-25 16:42:00 129
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人