nutch版本1.7 solr版本4.6.0
-------------------------------------------------------------------------------------------------------------------------------------
nutch的安装
linux下的安装非常简单,直接从以下路径下载1.7的版本,解压以后即可
http://mirror.esocc.com/apache/nutch/
在windows下,你需要安装一个cygwin来模拟unix的环境,
从 http://www.cygwin.com/ 下载cygwin,基本按照默认安装即可,然后将nutch下载完解压以后放入cygwin/home/username/就可以了
你可以在nutch目录下使用bin/nutch来检验nutch是否安装正确
注:nutch是java项目,所以需要jdk,我在cygwin下遇到了JAVA_HOME is not set. 但我的java环境变量是正确的。其实需要将java的环境变量设置为相对路径,问题就解决了,而且推荐将JDK的环境变量设置为相对路径。
如何设置jdk的环境变量 查看http://www.cnblogs.com/echofrank/p/3523133.html
在jdk配置正确之后,会出现错误 cygpath: can't convert empty path 这主要是因为java路径有空格的问题。解决方法如下:
---------------------------------------------------------------------------------------------------------------------------------------