自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

转载 vi常用命令

 进入vi的命令vi filename: 打开或新建文件,并将光标置于第一行首vi +n filename: 打开文件,并将光标置于第n行首vi + filename: 打开文件,并将光标置于最后一行首vi +/pattern filename: 打开文件,并将光标置于第一个与pattern匹配的串处vi -r filename: 在上次正用vi编辑时发生系

2009-04-28 11:00:00 536

转载 ubuntu下用jsvc把java程序做为linux服务启动

网上关于jsvc跑java的文章就搜到一篇,照着做结果还是出错,所以决定花点时间结合自己最终成功的体会记录下,加深印象。 linux环境:ubuntu8.10servertomcat:6.0.18jdk:1.6 1.安装jsvc在tomcat的bin目录下有一个jsvc.tar.gz的文件,进入tomcat的bin目录下#tar zxvf jsvc.tar.gz#cd js

2009-04-28 10:16:00 3838 1

转载 运行nutch常见几个错误

1.1.1   Crawl抓取出现hadoop出错提示配置完成nutch在cygwin中运行nutch的crawl命令时:[Fatal Error] hadoop-site.xml:15:7: The content of elements must consist of well-formed character data or markup.Exception in th

2009-04-27 22:37:00 4812 4

原创 windows下nutch1.0环境搭建及测试

先申明,此文非全部原创,结合网上资料加上自己测试环境记录的内容,做个记录加深自己的印象。 1.安装jdk并设置环境Jdk版本为1.6,在这里用了最简单环境设置,如果你设置不成功请参照网上教程,再此不过多说明.配置PATH环境变量;D:/soft/Java/jdk1.6.0_13/bin配置CLASSPATH环境变量 ,;配置NUTCH_JAVA_HOME为D:/soft/Java/jd

2009-04-27 14:35:00 3300 1

转载 Doug Cutting 访谈录 -- 关于搜索引擎的开发

作为Lucene和Nutch两大Apach Open Source Project的始创人(其实还有Lucy, Lucene4C 和Hadoop等相关子项目),DougCutting一直为搜索引擎的开发人员所关注。他终于在为Yahoo以Contractor的身份工作4年后,于今年正式以Employee的身份加入Yahoo下面是笔者在工作之余,翻译其一篇2年前的访谈录,原文(Doug C

2009-04-27 10:24:00 608

nutch 详细分析(包括配置文件等)

1 Nutch简介 2 1.1 nutch体系结构 2 2 抓取部分 3 2.1 爬虫的数据结构及含义 3 2.2 抓取目录分析 4 2.3 抓取过程概述 4 2.4 抓取过程分析 5 ………… 3 配置文件分析 3.1 nutch-default.xml分析 31 …………

2009-08-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除