- 博客(16)
- 收藏
- 关注
lucene控制台配置
从网上下了lucene2.9.0的包,开始着手研究;看到那些大牛们提到在控制台窗口中进行了研究,所以自己很想试试看: 1)解压缩lucene2.9.0的包后,会看到lucene-core-2.9.0.jar和lucene-demos-2.9.0.jar这两个包 2)将这两个jar包配置到系统环境变量classpath中 3)打开一个控制台终端,在其中运行相关命令即...
2009-10-18 21:26:38 140
原创 Collection 和 Collections的区别。
Collections是个java.util下的类,它包含有各种有关集合操作的静态方法。Collection是个java.util下的接口,它是各种集合结构的父接口。List, Set, Map是否继承自Collection接口? List,Set是 Map不是ArrayList和Vector的区别。一.同步性:Vector是线程安全的,也就是说是同步的,而A...
2009-07-11 17:37:56 104
搜索引擎(1)
(一)搜素引擎工作原理的两个重要的很容易混淆的问题:1)当用户提交查询的时候,搜索引擎[color=red]并不是[/color]即刻在web上“搜索”一通,发现那些相关的网页,形成列表呈现给用户;而是[color=blue]事先已“搜集”了一批网页,以某种方式存放在系统中[/color],此时的搜索只是在系统内部进行而已。2)当用户感到返回结果列表中的某一项很可能是他需要的,从而点击UR...
2009-07-08 20:32:06 188
原创 IT精英,必须掌握的命令行
一,ping 它是用来检查网络是否通畅或者网络连接速度的命令。作为一个生活在网络上的管理员或者黑客来说,ping命令是第一个必须掌握的DOS命令,它所利用的原理是这样的:网络上的机器都有唯一确定的IP地址,我们给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的数据包我们可以确定目标主机的存在,可以初步判断目标主机的操作系统等。下面就来看看它的一些常用的操作。...
2009-06-29 22:32:32 112
原创 20年后,你会比现在更幸福吗?
记得小时候,我很憧憬长大。因为我觉得等长大了,父母就再也管不着我了。可以想喝凉水就喝凉水,中午想不睡觉就不睡觉,那一定很幸福。等我真的长大,父母也的确管不着了,可当初认为的幸福并没有到来。因为,虽然没有人再管我喝凉水,但我发现当初那个理想太微不足道。而且,在得到这个微不足道的自由的同时,又有了新的更大的不自由。比如八点上班,哪怕迟到5分钟,领导也要给脸色看。而且那脸色,比小时候父母的难看得多。...
2009-06-27 21:49:39 95
Heritrix的总体架构
爬虫hertrix中的关键的几个类是:1)CrawlOrder2)CrawlController3)Frontier链接制造工厂以及BdbFrontier的实现方式4)多线程的实现(ToeThread和ToePool)5)处理链和Processer...
2009-06-27 11:10:05 97
原创 阅读源代码3
最后,对于在这篇文章中提到的分析源代码程序的一些方法做一下小结,以作为本文的结束。分析一个源代码,一个有效的方法是:1、阅读源代码的说明文档,比如本例中的README, 作者写的非常的详细,仔细读过之后,在阅读程序的时候往往能够从README文件中找到相应的说明,从而简化了源程序的阅读工作。2、如果源代码有文档目录,一般为doc或者docs, 最好也在阅读源程序之前仔细阅读,因为这些文...
2009-06-27 00:38:11 69
原创 阅读源代码2
由于工作的关系,我常常需要读一些源代码,并在上面做一些修改并且拿来使用,或者是借鉴其中的某些部分。可以说,open source对于程序员来说,是很有意义的事情。根据我的经验,读源代码,至少有3个好处。第一个好处是可以学习到很多编程的方法,看好的源代码,对于提高自己的编程水平,比自己写源代码的帮助更大。当然不是说不用自己写,而是说,自己写代码的同时,可以从别人写的好的源代码中间学习...
2009-06-27 00:37:29 234
原创 阅读源代码1
最近有做源码阅读的事情,觉得有些费尽,做了一些思考。一个大项目的源代码,不要过份详细的阅读。大项目,其代码量基本上是可以吓死人的。过份的关注细节,常常会拘泥于细节,而忽略了整体框架。当你能够看清框架的时候,亦花费了太多的时间。因此,阅读一个大项目的源代码,其目的不在于欣赏代码细节,而在于迅速看清项目整体框架的大概面貌:都有那些模块,这些模块是干嘛的(不关心具体怎么干),模块之间的通讯机制大...
2009-06-27 00:35:54 138
原创 java与C++的不同
java和c++的相似之处多于不同之处,但两种语言问几处主要的不同使得Java更容易学习,并且编程环境更为简单。我在这里不能完全列出不同之处,仅列出比较显著的区别:1.指针JAVA语言让编程者无法找到指针来直接访问内存无指针,并且增添了自动的内存管理功能,从而有效地防止了c/c++语言中指针操作失误,如野指针所造成的系统崩溃。但也不是说JAVA没有指针,虚拟机内部还是使用了...
2009-06-25 14:52:57 72
原创 摩托罗拉面试题3
c/c++: 1. static在c,c++中有什么不同点 2. 堆和栈的区别 3. 纯虚函数 4. 指针和引用的区别 5. 如果构造函数出错,如何处理? 6. 对设计模式是否熟悉,用过哪些? 7. c++如何使用c中的函数,为什么? 数据结构: 8. AVL,不懂,平衡二叉树,唉,咋叫这缩写呢 ...
2009-06-25 14:50:30 108
原创 摩托罗拉面试题2
1、智能指针,com实现的原理,2、printf()可变参数如何实现3、标准模板库vector追加数据如何实现。是底层如何实现,不能用现有的东东。4、还有,java的垃圾收集机制如何实现为什么?如果是你自己实现垃圾收集机制,如何实现? 用什么数据结构。5、二叉排序树和哈希表那个查找效率高,实用于pda 。6、.net的底层实现机制。7、进程间通信如何...
2009-06-25 14:49:44 103
原创 摩托罗拉面试题1
1.介绍一下STL,详细说明STL如何实现vector。Answer:STL (标准模版库,Standard Template Library.它由容器算法迭代器组成。STL有以下的一些优点:可以方便容易地实现搜索数据或对数据排序等一系列的算法;调试程序时更加安全和方便;即使是人们用STL在UNIX平台下写的代码你也可以很容易地理解(因为STL是跨平台的)。vect...
2009-06-25 14:47:51 109
爬虫的几个关键技术点
最近在研究爬虫的实现,看了几个代码,感觉在爬虫的设计中有几点很重要:1)网页的获取2)网页中URL的提取3)URL的合法性校验4)URL是否已经存在5)网页的深度的判断6)爬去策略?深度优先和广度优先...
2009-06-25 11:20:09 1410
CDL面试题(关于电信)
今天去IBM的CDL参加了面试,面试官提问了几个关于java基础的题,搞得我很郁闷。。。。1)java的clone2)java中的一个类中如何实现一个类的实例3)java中的一个类如何访问另一个类的方法,有几种方法4)设计模式中的单实例模式中若两个用户同时访问那个类,则单实例模式是否还起作用?5)java中的关键字public,private,protected,以及默认的属性...
2009-06-25 11:16:33 82
原创 开始学习搜索引擎
今天花了半天的时间将lucene2.0+Heritrix的第一个简单的小例子看明白啦。。。。。虽然涉及到Lucene的一些用法还是稀里糊涂 :( ,但是毕竟迈出了第一歩,加油哈。。。。...
2009-06-20 17:51:16 95
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人