Search Engineer
文章平均质量分 75
yinwp
NLPer
展开
-
Heritrix安装、配置
1.关于安装: 目前的版本号为1.12.1,官网地址为 http://crawler.archive.org/。常规安装,即解压到相关目录(不存在setup.exe安装模式),之后新建系统环境变量"HERITRIX_HOME"到该解压目录(Java环境已经配置好)。 2.安装的后续工作: 将 %HERITRIX_HOME%/heritrix-1.12.1.jar 解压到临时目录(随便找一个地方),拷贝其中的profiles目录到 %HERITRIX_HOME%/conf转载 2010-10-08 23:23:00 · 468 阅读 · 0 评论 -
Lucene2.0安装及测试
Lucene 2.0.0下载安装及测试 收藏<br />【下载】<br />下载链接:http://apache.mirror.phpchina.com/lucene/java/archive/<br />以选择lucene-2.0.0.zip下载为例。<br />【安装】<br />1、在本地磁盘解压缩lucene-2.0.0.zip文件;<br />2、将lucene-demos-2.0.0.jar和lucene-core-2.0.0.jar拷贝到JDK目录的lib目录下,例如:<b转载 2010-10-27 16:07:00 · 957 阅读 · 0 评论 -
MySQL常用语法(整理后)
一、 MySQL使用导引 1. 登录MySQL方法一:直接打开程序---》MySQL----》MySQL Command Line Client输入password就好。方法二:运行----》cmd----》进入MySQL安装目录下的bin目录(或者设置好环境变量)输入如下命令:mysql –u root -p如下图:然后输入password。MySQL的出错声音很烦人,如果想去掉的话在进入MySQL时可以用以下命令:mysql -u root原创 2010-10-27 17:20:00 · 782 阅读 · 0 评论 -
Bloom Filter概念和原理
<br />Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom Filter通过极少的错误换取了存储空间的极大节省。集合表示和元素查询<br />下面我们具体来看Bl原创 2011-01-03 10:11:00 · 447 阅读 · 0 评论 -
Lucene入门之--运行Lucene-demo
<br />运行环境: JDK 1.5 TOMCAT 5.5 Eclipse 3.0.1 解压lucene1.4.3 把luceneweb.war复制到tomcat的webapps目录,重新启动tomcat,就可以看到目录下多了一个luceneweb目录 新建一个index文件夹,位置不限,用来存放生成的索引文件。这里在D:/Tomcat5.5/webapps/luceneweb/index 在Eclipse下建立个工程,取名LuceneTest,并添加所需的jar包。Lucene-1.4.原创 2010-11-16 09:28:00 · 622 阅读 · 0 评论 -
About Memes
<br />来源:http://www.susanblackmore.co.uk/memetics/about%20memes.htm<br /> <br />The term meme (it's pronounced like dream or cream) was coined by Richard Dawkins, Professor of the Public Understanding of Science at Oxfo原创 2011-01-26 20:43:00 · 631 阅读 · 0 评论