Nutch1.0+Tomcat6.0+JDK1.6环境搭建搜索引擎
主要参考资料:
细枝末节就不用咪西了,说下我搭建过程中出现几个问题:
首先要清楚Nutch要在XP上运行就得有CYGWIN(WIN上的类LINUX系统)的支持.
假设该做的都做了,结果遇到异常.
1可能会遇到:
java.lang.UnsupportedClassVersionError: Bad version number in .class file
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:620)
主要原因是没在JDK1.6环境下运行!最大可能是在MyEclipse中启动Tomcat出现这个问题,因为一般在MyEclipse中配置的Tomcat默认的加载MyEclipse自带的JDK(不一定就是1.6版本),所以手动改JDK1.6!异常解决了!
2. 遇到下面的异常
2009-04-09 17:09:02,984 INFO NutchBean - creating new bean
2009-04-09 17:09:03,093 WARN FileSystem - uri=file:///
javax.security.auth.login.LoginException: Login failed: Cannot run program "whoami": CreateProcess error=2, ?????????
at org.apache.hadoop.security
这个原因是装好CYGWIN后没有将 bin目录添加到path!将环境变量path中加入:如D:\cygwin\bin然后重启tomcat
当然用MyEclipse的重启MyEclipse!
3.
2009-10-08 16:10:18,281 INFO  SearchBean - opening merged index in G:/nutch-1.0/crawl-tinysite/crawldb/current/part-00000/index <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

2009-10-08 16:10:18,359 ERROR NutchBean - java.io.IOException : G:\nutch-1.0\crawl-tinysite\crawldb\current\part-00000\index not a directory

文件的路径不正确 , 随便改了 , 关键是不能有空格存在 !